Introdução 
а Теопа 


da Probabilidade 


É Hoel | 
[ Port 


LA 


Introdução 
а Teoria 
da Probabilidade 


ace ы AM 
PIBLiIOTE 


» UNIR 


FUNDO EDITORIAL 


| —Ó —— -——— 


Batschelet- Introducáo à Matemática para Biocientistas 

Bensaid — A Consulta Médica 

Bingham/Davies — Manual de Análise de Sistemas 

Buecken — Vocabulário Técnico — Portugués, Inglés, Francés e Alemáo 
Coutinho — Jardim, Horta e Pomar 

Dacorso — Elementos de Geometria Diferencial 

Dawson/Wool — De Bits até If's — Uma Introdução ao Estudo dos Computadores e Fortran IV 
Gomes/Helluy — Manual de Arquivo e Documentacáo 

Harcourt e Laing (coordenadores) — Capital e Crescimento Económico 
Langridge — Classificacáo — Abordagem para Estudantes de Biblioteconomia 
Leonhardt — Construções de Concreto — Vol. 1, Vol. 2e Vol. 3 

Lindgren — Temas de Planejamento 

Mason/Mello e Souza — Métodos de Energia 

McCullers/Van Daniker — Introdução à Contabilidade Financeira 

McKinnon — A Moeda e o Capital no Desenvolvimento Económico 

Mitidieri — Problemas e Exercícios em Bioquímica 

Motta Rezende — Materiais Usados em Eletrotécnica 

a Pemberton — Arranjo Físico Industrial e Movimentação de Materiais 


-E 


Piedade — Introdução à Teoria da Classificação 
Polya — A Arte de Resolver Problemas 
Rego Monteiro — Tesouras de Telhado 
Richardson — Economia Urbana 
Silva Telles — Materiais para Equipamentos de Processo 
Silva Telles/Paula Barros — Tabelas e Gráficos para Projetos de Tubulações — 23edicáo 
Stephanes/Ferreira — Planejamento, Orçamento e Programação Financeira 
Suszczynski — Os Recursos Minerais Reais e Potenciais do Brasil е sua Metalogenia 
| Swann — Técnicas de Aumento da Produtividade 
Я Swingewood — О Mito da Cultura de Massa 
Е Thomson — Teoria da Vibração com Aplicações 


Wilmer/Pereira — Geometria para Desenho Industrial 


Introdução 
а Teoria 
da Probabilidade 


Paul G. Hoel Sidney C. Port 
Charles J. Stone 


Universidade da Califórnia — Los Angeles 


_————————————————— 


TRADUCAO 


Fernando Yassou Chiyoshi 


EDITORA INTERCIÉNCIA 


FUBDAC ! à [> 
, FEDERAL DE RONDONIA 1 Fi % 
k BIBLIOTECA 
sa 


аан e ADO TE n O oam urn 


| Copyright © 1971 by Houghton Mifflin Company 
f Published in the United State by Houghton Mifflin Company under 
À the title Introduction to Probability Theory. 


Direitos reservados em 1978 por 
Editora Interciência Ltda. 
Rio de Janeiro, Brasil 


Programação Visual — Interciência Arte 
Capa — Interciência Arte 
Composição do texto — Interciência 


CIP-Brasil. Catalogação-na-fonte 
Sindicato Nacional dos Editores de Livros, RJ. 


Hoel, Paul G. 

H634i Introducáo à teoria da probabilidade / Paul G. Hoel, Sidney C. Port, 
Charles J. Stone; traducáo / de / Fernando Yassou Chiyoshi. — Rio de 
Janeiro: Interciéncia, 1978. 


Traducáo de: Introduction to probability theory 
Bibliografia 


1. Probabilidades |. Port, Sidney C. 
Il. Stone, Charles J. 111. Título 


CDD — 519 
78-0330 CDU — 519 pe 


É proibida a reprodução total ou parcial por quaisquer meios 
sem autorização por escrito da editora 


e EDITORA INTERCIÉNCIA LTDA. 
Bi Rua Verna Magalháes, 66 - Tels.: 281-7495/263-5899 


ZC-16 — 20000 — Rio de Janeiro — Brasil 


КЕ. 0 oc. cec 


PREFÁCIO 


O propósito deste volume é servir como um texto, para curso de um trimestre 
ou um semestre, sobre teoria da probabilidade a nível jünior-senior. O material 
foi planejado para dar ao leitor preparação adequada, tanto para um curso de estatís- 
tica como para estudos mais avançados de teoria da probabilidade e processos estocás- 
ticos. O pré-requisito para este volume é um curso de cálculo elementar que inclua 
integração múltipla. 

Dedicamos esforços para apresentar somente os conceitos mais importantes 
da teoria da probabilidade. Tentamos explicar esses conceitos e indicar sua utilidade 
através de discussão, exemplos e exercícios. Alguns detalhes foram incluídos nos 
exemplos, de modo que se pode esperar, que o estudante os leia por conta própria, 
deixando assim ao instrutor mais tempo para cobrir as idéias essenciais e resolver 
um número considerável de exercícios em sala. 

Há um grande número de exercícios ao final de cada capítulo, dispostos 
de acordo com a ordem em que o material relevante foi introduzido no texto. 
Alguns desses exercícios são de natureza rotineira, enquanto outros desenvolvem 
as idéias introduzidas no texto de forma um pouco mais profunda ou em direção 
um pouco diferente. Oferecemos sugestões para problemas mais difícies. Respostas, 
quando não são indicadas no próprio enunciado dos problemas, são fornecidas 
ao final do livro. 

Embora a maior parte da matéria neste volume seja essencial para estudo 
mais avançado de probabilidade e estatística, algum material opcional foi incluído 
para dar maior flexibilidade. Essas seções opcionais são indicadas através de um 
asterisco. O material da Seção 6.2.2 é necessário somente para Seção 6.6; nenhuma 
dessas seções é necessária para este volume, mas ambas são necessárias em Introdução 
à Teoria Estatística. O material da Seção 6.7 é usado somente na demonstração 
do Teorema 1 do Capítulo 9 deste volume e Teorema 1 do Capítulo 5 de Introdução 
à Teoria Estatística. Os conteúdos dos capítulos 8 e 9 são opcionais; o Capítulo 9 
não depende do Capítulo 8. 

Desejamos agradecer a diversos colegas que leram o manuscrito original e 
fizeram sugestões, nos levando a um melhor resultado. Gostaríamos, também, 
de agradecer a Neill Weiss e Luis Gorostiza por terem resolvido e dado respostas 
a todos os exercícios e à Sra. Ruth Goldstein pelo excelente trabalho de datilografia. 
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Е$РАСО$ DE PROBABILIDADE 


A teoria da probabilidade é o ramo da matemática relacionado com fenómenos 
aleatórios (ou casuais). Muitas pessoas tém se dedicado ao seu estudo, devido ao 
seu interesse intrínseco, bem como às muitas aplicações bem sucedidas em muitas 
áreas das ciências físicas, biológicas e sociais, na engenharia e no mundo dos negócios. 

Muitos fenômenos têm a propriedade de a sua observação, repetida sob um 
conjunto especificado de condições, conduzirem invariavelmente ao mesmo resultado. 
Por exemplo, se deixarmos cair uma bola, inicialmente em repouso, de uma altura 
de d pés através de vácuo ela atingirá o solo invariavelmente em t= vy 24/0 
segundos, onde g = 32 pés/s? é a aceleração constante devido à gravidade. Existem 
outros fenômenos cuja observação, repetida sob um conjunto especificado de con- 
dições, não conduz sempre ao mesmo resultado. Um exemplo familiar deste tipo 
de fenômeno é o lançamento de uma moeda. Se uma moeda é lançada 1000 
vezes, as ocorrências de caras e coroas se alternam de uma forma aparentemente 
irregular e imprevisível. São fenômenos desse tipo que consideramos como sendo 
aleatórios e que constituem o objeto de nossa investigação. 

À primeira vista pode parecer impossível fazer qualquer afirmação válida sobre 
tais fenômenos aleatórios, porém este não é o caso. A experiência mostra que 
muitos fenômenos não-determinísticos exibem uma regularidade estatística, que os 
torna passíveis de estudo. Isto pode ser ilustrado considerando novamente o lança- 
mento de uma moeda. Para qualquer lançamento individual da moeda não podemos 
fazer nenhuma previsão não-trivial, mas as observações mostram que para um grande 
número de lançamentos a proporção de caras parece oscilar em torno de algum 
número fixo p entre O e 1 (sendo p muito próximo de 1/2 se a moeda é razoavel- 
mente balanceada). Os resultados se comportam como se a proporção de caras 
em n lances, convergisse para p, ao fazer n tender a infinito. Pensamos nesta 
proporção limite p como a “probabilidade” que a moeda caia, em um único lança- 
mento, com a cara voltada para cima. 

De uma forma mais geral, a afirmação que um certo resultado experimental 
tem probabilidade p, pode ser interpretada, como significando que, se o experi- 
mento é repetido um grande número de vezes, aquele resultado seria observado 


“cerca de" 100p por cento das vezes. Esta interpretação é chamada interpretação 
de freqüéncia relativa. Ela é muito natural em diversas aplicações da teoria da 
probabilidade aos problemas do mundo real, especialmente aqueles que envolvem 
as ciéncias físicas, porém freqüentemente parece ser bastante artificial. Por exemplo. 
como poderíamos dar uma interpretacáo de freqüéncia relativa para a probabilidade 
de que uma criança recém-nascida viva pelo menos 70 anos? Várias tentativas foram 
feitas, nenhuma delas totalmente aceitável, para dar interpretações alternativas a 
tais asserções probabilísticas. 

Para a teoria matemática da probabilidade, a interpretação de probabilidades 
é irrelevante, exatamente como é irrelevante, na geometria, a interpretação de pontos, 
retas e planos. Usaremos a interpretação de frequência relativa para probabilidades, 
apenas, como uma motivação intuitiva para as definições e teoremas que desenvol- 

| veremos ao longo do livro. 


1.1. EXEMPLOS DE FENÔMENOS ALEATÓRIOS 


Nesta seção discutiremos dois exemplos simples de fenômenos aleatórios com 
o objetivo de motivar a estrutura formal da teoria. 
Exemplo 1. Uma caixa contém 5 bolas idênticas, porém numeradas de 1 a 5. Consi- 
dere o seguinte experimento. As bolas são bem misturadas dentro da caixa e uma 
pessoa retira uma bola. Anota-se o número da bola, recolocando-a na caixa. O resul- 
tado do experimento é o número da bola selecionada. Não podemos fazer nenhuma 
previsão não-trivial sobre este experimento. 

Suponha que repetimos п vezes o experimento acima. Denote por N,(k) 
o número de vezes que a bola de número k foi retirada nos n ensaios do experi- 
mento. Admita que tenhamos, s = 3 bolas e n = 20 ensaios. Os resultados destes 
20 ensaios poderiam ser descritos listando os números que apareceram na ordem 
em que foram observados. Um resultado típico poderia ser 


BUS LSS A E E E 2, 


e neste caso teríamos 


№,,(1) = 5, №, ,(2) = 8, е №, (3) = 7. 
As frequências relativas (isto é, proporção de vezes) dos resultados 1, 2 е 3 <$ 
são então | 
Мы = 0,25, М2) 2902) = 0,40, e Po). = 0335. 
А medida que o número de ensaios aumenta, espera-se que as frequências rela- 
tivas №, (1)/п, . . . , Nn(s)n se ajustem a alguns números fixos p1, 2, .. ., Py D 


(que, segundo nossa intuição, neste caso, deveriam ser iguais a 1/s). 

Pela interpretação de frequência relativa, o número p; seria a probabi- 
lidade de que a i-ésima bola seja retirada quando o experimento é realizado 
uma vez (i=1,2,...,5). 


' | | 


Construiremos agora um modelo matemático para o experimento de retirar 
uma bola da caixa. Para isto, tomamos primeiro um conjunto (2 contendo s 
pontos que colocamos em correspondéncia biunívoca com os possíveis resultados 
do experimento. Nesta correspondência exatamente um ponto de Q estará associado 
com o resultado de que a bola com o número Ж seja selecionada. Chamemos 
este ponto coy. Associemos ao ponto c o número рк = 1/5 chamando-o de pro- 
babilidade de wg. Observamos de imediato que 0О<р„<1 eque p, t---tpg— 1. 


Suponha agora que além de serem numeradas de 1 a s, as r primeiras bolas, 
são pintadas de vermelho e, as s — r restantes, são pintadas de preto. Realizamos 
о experimento como antes, mas agora estamos interessados apenas na cor da bola 
e não no seu número. Uma rápida reflexão mostra que a frequência relativa de bolas 
vermelhas retiradas.nas п repetições do experimento é simplesmente a soma das 
frequências relativas N,(k)/n, sobre os valores de К, que correspondem a bolas 
vermelhas. Esperaríamos, e a experiéncia confirma, que para п grande, esta fre- 
qüéncia relativa se ajustasse a algum nümero fixo. Como, para п grande, espera-se 
que as freqüéncias relativas ,(K)/n estejam próximas de py = 1/5, anteciparíamos 
que a freqüéncia relativa de bolas vermelhas se aproximaria de r/s. Novamente a 
experiência confirma este fato. Segundo a interpretação de frequência relativa, 
chamaríamos então r/s de probabilidade de obter uma bola vermelha. 


Vejamos como podemos incorporar este fato no nosso modelo. Seja 4 o 
subconjunto de Q, consistindo daqueles pontos wg tais que a bola k é vermelha. 
Então А contém exatamente r pontos. Chamamos А um evento. De uma forma 
mais geral, nesta situação, chamaremos qualquer subconjunto B de Q um evento. 
Dizer que o evento B ocorre, significa que o resultado do experimento é repre- 
sentado por algum ponto de B. 


Sejam А e B dois eventos. Lembre-se que a união de А е B, АОВ, ёо 
conjunto de todos os pontos w € Q tais que w € А ou wEB. Agora os pontos 
em Q estão em correspondência com os resultados do nosso experimento. O evento 
A ocorre se o experimento produz um resultado que é representado por algum 
ponto em 4, e analogamente o evento B ocorre se o resultado do experimento 
é representado por algum ponto em B. O conjunto AUB representa, então, o fato 
que o evento А ocorre ou o evento B ocorre. De forma similar, a mterseção 
ANB de А e B consiste de todosos pontos que estão tanto em 4 quanto ec 5 
Assim se w EA NB então vEA e wEB de modo que AB representa o бза 
de que ambos os eventos А e B ocorrem. O complemento A“(ou A) З= 4 # = 
conjunto de pontos em Q que não estão em А. O evento А não om зе o 
experimento produz um resultado representado por um ponto em А 


Em um diagrama, se А e B são representados pelas regiões mdcade m 
Figura la, então AUB, ANB, e Aº são representados pelas regiões sombreadas 
nas Figuras 1b, 1с e 1d, respectivamente. 


1а 1 1b 


9 Q 
s B 
AUB 
T — s | 
ТЕ 1а 
| e | | 
АПВ mf 


Figura 1 
Para ilustrar estes conceitos seja А о evento "bola vermelha selecionada" 
e seja B o evento “bola selecionada com um número par”. Então a união A U B 
é o evento em que foi selecionada uma bola vermelha ou uma bola com nümero 
par. A interseção А N B. é o evento “seleção de bola vermelha com número par”. 
O evento A^ ocorre se nào foi selecionada uma bola vermelha. 


Gostaríamos agora de associar probabilidades aos eventos. Matematicamente, 
isto significa simplesmente que associamos a cada conjunto В um nümero real. 
A priori poderíamos fazer isto de uma forma arbitrária. Entretanto, estaremos 
restringidos, se desejarmos que estas probabilidades reflitam o experimento que 
estamos tentando modelar. Como deveríamos fazer esta associação? Já associamos 
а cada ponto o número s^!. Assim, a um conjunto de um único ponto (c ) deveria 
ser associado o número s^!. Agora, de nossa discussão sobre a frequência relativa 
do evento “extrair bola vermelha”, parece que devemos associar ao evento 4 a 
probabilidade P(A) = r/s. De uma forma mais geral, se В é um evento qualquer, 
definiremos P(B) através de P(B) = j/s, se B tem exatamente j pontos. Obser- 
vamos então que 


P(B) = 2 Pk > 


wk E В 


onde Ук c p Pk significa que somamos os números py sobre os valores de k 
tais que c € B. Da nossa definição de P(B) segue-se facilmente que as afirmações 
seguintes são verdadeiras. Deixamos sua verificação para o leitor. 

Seja ф o conjunto vazio; então Р(ф) = 0 е P(Q)=1. Se А e B são dois 
conjuntos disjuntos quaisquer, isto é, А O B = então 


P(A U B) = P(A) + P(B). 


Exemplo 2. Sabe-se de experimentos físicos que um isótopo de uma certa subs- 
táncia é instável. Com o passar do tempo ele se degrada para uma forma mais estável 
através da emissão de nêutrons. Estamos interessados no tempo que um átomo de 
um isótopo leva para se degradar à forma estável. De acordo com as leis da física 
é impossível dizer com certeza quando um átomo específico se desintegrará, mas se 
observamos um número N de átomos, podemos fazer algumas previsões precisas 
sobre o número (ft) de átomos que não se desintegram até o tempo /. Em outras 
palavras, podemos prever, com bastante precisão, a fração N(t)/N de átomos que 
não se desintegram até o tempo f, mas não podemos dizer quais os átomos que 
permanecerão inalterados. Já que todos os átomos são idênticos, observar simul- 
taneamente se V átomos seria equivalente a № repetições do mesmo experimento 
onde, neste caso, o experimento consiste em observar o tempo que um átomo leva 
para se desintegrar. 

Em primeira aproximação (que é na realidade bastante precisa), a taxa com 
que o isótopo se desintegra, no tempo f, é proporcional ao nümero de átomos 
presentes no tempo t, de modo que N(t) é dado aproximadamente pela solução 
da equação diferencial 


df 
dt 


onde A > 0 é uma constante de proporcionalidade. A solução única desta equação 
é f(t) = №№, de modo que, a fração de átomos que não se desintegram até o 
tempo f£, é dada aproximadamente рог N(t)/N = е. Se O< to € ту, a fração 
de átomos que se desintegram no intervalo de tempo [to, tj] é (е^ — e^Mi ). 
Conseqüentemente, de acordo com a interpretação de probabilidade como frequência 
relativa, tomamos (e"Mo — е.) como a probabilidade de que um átomo se 
desintegre entre os tempos £o e £i. 

Para fazer um modelo matemático deste experimento podemos tentar proceder 
como no exemplo anterior. Primeiro escolhemos um conjunto 9 que possa ser 
posto em correspondéncia um a um com os possíveis resultados do experimento. 
Um resultado, neste caso, é o tempo que um átomo leva para se desintegrar. Ele pode 
ser qualquer número real positivo, assim tomamos © como sendo o intervalo 
[0, œ) sobre o eixo dos números reais. De nossa discussão acima parece razoável 
associar a probabilidade (е Me — е At) ao intervalo [fo, tı]. Em particular, 
se to = f, = f, o intervalo se degenera no conjunto { t ) e a probabilidade associada 
a este conjunto é О. 


e cA Jp ew, 


No exemplo anterior 9 tinha apenas um número finito de pontos; entre- 
tanto,aqui (2 tem um nümero infinito (nào enumerável) de pontos e cada ponto 
tem probabilidade O. Observamos novamente que Р(9) = 1 e Р(ф) = 0. Suponha 
que 4 e B sejam dois intervalos disjuntos. Então, a proporção de átomos que se 
desintegram no intervalo de tempo А U B, é a soma das proporções de átomos que 
se desintegram no intervalo А e no intervalo B. А luz desta aditividade exigimos 


& 


que no nosso modelo matemático А U В tenha a probabilidade P(A) + P(B) a ele 
associada. Em outras palavras, no nosso modelo matemático desejamos que 


P(A U B) = P(A) + P(B) 


sempre que А e B forem intervalos disjuntos. 


1.2. ESPAÇOS DE PROBABILIDADE 


Nosso propósito nesta seção é desenvolver uma estrutura matemática formal, 
chamada espaço de probabilidade, que forma a base para o tratamento matemático 
de fenômenos aleatórios. 

Considere um experimento real ou imaginário que estamos procurando modelar. 
A primeira coisa que devemos fazer é decidir sobre os possíveis resultados do expe- 
rimento. Não é muito sério se admitirmos, em nossa consideração, mais coisas 
do que realmente podem acontecer, mas desejamos estar certos de que não excluímos 
coisas que podem ocorrer. Uma vez decididos sobre os possíveis resultados, esco- 
Ihemos um conjunto Q cujos pontos c» estão associados a esses resultados. Entre- 
tanto, do ponto de vista estritamente matemático, 0 é simplesmente um conjunto 
abstrato de pontos. 

Tomamos a seguir uma coleção não vazia 27 de subconjuntos de Q, que 
representará a coleção de "eventos" aos quais desejamos associar probabilidades. 
Agora, um evento significa por definição um conjunto А em „7. A afirmação: 
O evento A ocorre, significa que o resultado do nosso experimento é representado 
por algum ponto w E A. Novamente, do ponto de vista estritamente matemático, 
“4 é apenas uma coleção especificada de subconjuntos do conjunto Q. Serão 
associadas probabilidades apenas aos conjuntos. А €, isto é, eventos. No modelo 
do Exemplo 1, «7 consistia de todos os subconjuntos de О. Na situação geral em 
que Q não tem um número finito de pontos, como no Exemplo 2, pode não ser 
possível escolher . desta maneira. | 

O problema seguinte é, o que deve ser a coleção .27 ? É bastante razoável 
exigir que . seja fechado sob uniões finitas e interseções finitas dos conjuntos 
em 7 ; bem como sob complementação. Por exemplo, se А e В são dois eventos, 
А U B ocorre se o resultado do experimento é representado por um ponto em А 
ou em B. Claramente então, faz sentido falar sobre as probabilidades de que 4 e B 
ocorram, também deve fazer sentido falar sobre a probabilidade de que ou А ou B 
ocorra, isto é, de que o evento А U B ocorra. Já que associaremos probabilidades 
somente aos conjuntos em .97 , devemos exigir que А U B € X sempre que 
A e В são membros de X. Por outro lado А NB ocorre se o resultado do 
experimento é representado por algum ponto que está em ambos os conjuntos 
A e B. Um raciocínio, análogo ao seguido para 4 UB, convence-nos que devemos 
ter AN BE, sempre que А, B € XJ. Finalmente dizer que o evento А não 
ocorre é dizer que o resultado do experimento não é representado por um ponto 
em 4, de modo que ele deve ser representado por algum ponto em A^. Seria o 
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cümulo da tolice dizer que podemos falar em probabilidade de 4 mas nào па 
probabilidade de 4^. Assim exigiremos que 4^ esteja em А sempre que „7 
estiver em A^. 


Chegamos assim à conclusão de que . deve ser uma coleção não vazia de 
subconjuntos de Q tendo as seguintes propriedades: 


(i Se А estáem .Z também está em A^. 
(1) Se A e B еѕійоет 2 AUB e А. В também estão 


Um simples argumento indutivo mostra que se 4,, 45, ..., An são conjuntos 
em, (7, А, e (i-i; 4; também о são. Aqui, usamos a notação abreviada 


UA =й, о ARTE 


A sm A ү A ас АБ. 


Já que A149 = фе AU А = 9, vemos também que o conjunto vazio e o 
conjunto © devem estar em „7. 

Uma coleção não-vazia de subconjuntos, de um dado conjunto £2, que é 
fechada sob finitas operações da teoria dos conjuntos, é chamada álgebra de sub- 
conjuntos de О. Portanto, parece que devemos exigir que . seja uma álgebra 
de subconjuntos. Acontece, entretanto, que devido a certas razões matemáticas, 
é insuficiente tomar sZ como sendo uma álgebra de subconjuntos. O que realmente 
exigiremos da coleção . é mais restritivo. Exigiremos que ./ seja fechada não 
somente sob finitas operações da teoria dos conjuntos, mas também, sob um número 
infinito enumerável de operações da teoria dos conjuntos. Em outras palavras, 
se {An}, п > 1, é uma sequência de conjuntosem .27, exigiremos que 


U4,es e (| As x. 
п=1 п=1 
Usamos aqui a notação 
Џ 4, = 4; 0А, о 
n=1 


para representar a união de todos os conjuntos da seqüéncia e 


П А„= А, с 4, с--- 


n-i 
para representar a interseção de todos os conjuntos de seqüéncias. Uma coleção 
de subconjuntos, de um dado conjunto Q, que é fechada sob um número infinito 
enumerável de operações da teoria dos conjuntos é chamada o-álgebra de subcon- 
juntos de О. (Usa-se o para distinguir uma tal coleção de uma álgebra de sub- 
conjuntos.) De um modo mais formal, temos a seguinte: 


Definição 1. Diz-se que uma coleção não-vazia . de subconjunto de Q é 
uma o-álgebra de subconjuntos de Q, desde que, as seguintes propriedades sejam 
satisfeitas: 

(1) Se A estáem s, AC também está em £. 

(й) Se An estáem 4,n=1,2,...,então Ji, An e (52, А, também 

estão em .27. | 


Chegamos agora ao problema de associar probabilidades aos eventos. Deixamos 
claro nos exemplos da seção anterior que a probabilidade de um evento é um número 
real não-negativo. Para um evento А, seja P(A) a sua probabilidade. Então 
0 < P(A) < 1. Ao conjunto Q representando todos os resultados possíveis deve, 
naturalmente, ser associado o número 1, de modo que P(Q) = 1. Mostramos na 
discussão do Exemplo 1 que se 4 e B são dois eventos disjuntos quaisquer, 
P(A U В) = P(A) + P(B). De forma semelhante, mostramos no Exemplo 2 que 
se А e В são dois intervalos disjuntos, devíamos exigir também que 


P(A U B) = Р(А) + P(B). 

Parece então razoável exigir, em geral, que se А e B são dois eventos dis- 
juntos, então P(A U В) = P(A) + P(B). Se seguiria então por indução que se 
4;,,42,..., Ag são n conjuntos mutuamente disjuntos (isto é, se 4; ПА; = ф. 
sempre que i +j), então 


P (0 4) = 2 Р(А;). 


Na realidade, novamente por razões matemáticas, exigimos que esta proprie- 
dade aditiva se verifique para coleções enumeráveis de eventos disjuntos. 


Definição 2. Uma medida de probabilidade P, sobre um -álgebra de 
um subconjunto . de um conjunto 9, é uma função real cujo domínio é 
e que satisfaz as seguintes probabilidades: 


O) Р(О)=1. 

(0) Р(4) 20 para todo A € A. 

(iii) Se Ap, n= 1, 2,3,... , são conjuntos mutuamente disjuntos em 4, 
então 


Р (0 ^) © T Р(А,). 


Um espaço de probabilidade, representado рог (9, £, Р), é um conjunto 
Q, um c-álgebra de subconjuntos . e uma medida de probabilidade P defi- 
nidaem „7. 


É bastante fácil encontrar um espaço de probabilidade que corresponda ao 
experimento de extrair uma bola de uma caixa, e este, já foi dado, em essência, 
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na discussão deste experimento. Simplesmente tomamos © como sendo um con- 
junto finito contendo s pontos, . como sendo a coleção de todos os subconjuntos 
de (2 e P como sendo a medida de probabilidade que associa a probabilidade 
P(A)= jjs aoevento А se А contém exatamente j pontos. 

Consideremos agora o espago de probabilidade associado ao experimento 
đa desintegração de isótopo (Exemplo 2). Neste caso, é claro que Q = [0, =), 
mas não é tão óbvio o que. e P devem ser. Na verdade, como indicaremos 
abaixo, este não é, de modo algum, um problema trivial, e sim um problema em que 
todas zs suas ramificações dependem de algumas propriedades da teoria dos con- 
jatos que estão além do escopo deste livro. 

Uma coisa no entanto é clara: quaisquer que sejam as escolhas de 4 e P, 
= deve conter todos os intervalose Р deve associar a probabilidade (e Ao — e At) 
2o mterezo [г„‚ Гү], se desejamos que o espaço de probabilidade que estamos 
construindo, reflita a situação física. Então o problema-de construir um espaço 
irensfomma-se no seguinte problema, puramente matemático: Existe um o-álgebra 
x que contenha todos os intervalos e uma medida de probabilidade Р definida 
em x que associa a probabilidade desejada P(A) ao intervalo А? Problemas 
deste шро estão no domínio de um ramo da matemática avançada chamada teoria 
da medida = não podem ser tratados ao nível deste livro. Resultados da teoria da 
medde mostram que a resposta a este problema particular e a outros de mesma 
пашытта ё afirmativa, tais construções são sempre possíveis. 

Não nos deteremos em construções de espaços de probabilidades em geral. 
А o matemática da probabilidade começa com um espaço abstrato de proba- 
Distad= г desenvolve a teoria usando o espaço de probabilidade como uma base 
de operação Executando a formação de uma base para definir precisamente outros 
conceitos envolvidos na teoria, o espaço de probabilidade desempenha um papel 
mmo pequeno no desenvolvimento subsequente da teoria. Quantidades auxiliares 
[especisimente variáveis aleatórias, um conceito abordado no Capítulo 3) se trans- 
formam rapidamente em tema dominante da teoria e, o espaço de probabilidade 
em Si recus para um plano secundário. 

Comciwemos a discussão de espaços de probabilidade construindo uma 
mpate classe de espaços de probabilidade denominados espaços uniformes 
de probebilidade. 

Alguns problemas mais antigos em probabilidade envolvem a idéia de escolher 
“зо acaso” um ponto de um conjunto 5. Nossas idéias intuitivas sobre esta noção 
nos mostram que зе А е В são conjuntos de mesmo “tamanho”, a chance de 
escolher um ponto de А deve ser a mesma que a de escolher de В. Se S tem 
apenas um número finito de pontos, podemos medir o tamanho de um conjunto 
por meio de sus cardinalidade. Assim dois conjuntos são do mesmo “tamanho” 
se contêm o mesmo número de pontos. É bastante fácil construir um espaço de 
probabilidade correspondente ao experimento de escolher ao acaso um ponto de 
um conjunto S. Tomamos Q = 5 e s como sendo todos os subconjuntos de S, 
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e associamos ao conjunto 4 a probabilidade P(A) = j/s se А é um conjunto 
que contém exatamente j pontos. Tal espaço de probabilidade é chamado espaço 
simétrico de probabilidade porque cada conjunto com um ponto tem a mesma 
probabilidade s”!. Voltaremos ao estudo de tais espaços no Capítulo 2. 

Suponha agora que 5 é o intervalo [a,b] sobre o eixo real, onde 
—œ < а < b< + ©, Neste caso, parece razoável medir o “tamanho” de um sub- 
conjunto 4 de [a, b] através do seu comprimento. Então, dois conjuntos são 
do mesmo tamanho se tiverem o mesmo comprimento. Representaremos o com- 
primento de um conjunto А por |A|. 

Para construir um espaço de probabilidade para o experimento de “escolher 
ao acaso um ponto S” procedemos de maneira semelhante àquela adotada para 
o experimento do isótopo. Tomamos Q = 5 e lançamos mão dos resultados da 
teoria da medida, que mostram que existe um o-álgebra . de subconjuntos de 
S e uma medida de probabilidade P definida ет .2 tal que P(A) = |А|/|$| 
sempre que А é um intervalo. 

De uma forma mais geral, seja 5 um subconjunto qualquer do espaço Eucli- 
diano r-dimensional, tendo um volume r-dimensional finito e não nulo. Seja |A | 
o volume de um subconjunto А de S. Então, existe um o-álgebra . de sub- 
conjuntos de S que contém todos os subconjuntos de 5 que possuem volumes a 
eles associados como em cálculo e uma medida de probabilidade P definida em 
A% tal que P(A) = |A]|/|S| para qualquer conjunto А. Tal espaço será desig- 
nado espaço uniforme de probabilidade e representado por (5,.97,Р). 


1.3. PROPRIEDADES DAS PROBABILIDADES 


Derivaremos nesta seção algumas propriedades adicionais de uma medida 
de probabilidade P que decorrem de sua própria definição. Estas propriedades 
serão usadas constantemente ao longo do restante deste livro. Assumiinos que 
seja dado algum espaço de probabilidades (О, .2, P) e que todos os conjuntos 
em discussão são eventos, isto é, membros de .27. 

Para um conjunto qualquer А temos А U A^ = Q eassim para dois con- 
juntos quaisquer 4 e B temos a decomposição de B: 


(1) B=QNB=(AVA)NB=(ANB)U(AC NB). М 


Uma vez que А NB e A^ N В são disjuntos, vemos que de (iii) da Defi- 
nicáo 2 que ni 


(2) P(B) = P(A n B) * P(A" n B). 
Fazendo В = €) e lembrando que P(Q) = 1, concluímos de (2) que е 
(3) P(A^) = 1 — P(A). 


Em particular Р(ф) = 1 — Р(9), de modo que 
(4) Р(ф) = 0. 


p Ў edisi 


1 


y 


Como uma segunda aplicação de (2), suponha que А С B. Então AN В=А e 
portanto 


(5) P(B)=P(A)+P(AC NB) se A CB. 
Já que Р(А© П В) 20 em virtude de (ii), vemos de (5) que 
(6) P(B)>P(A) se А CB. 


As leis de De Morgan estabelecem que se (4,) , n > 1, é uma sequência 
qualquer de conjuntos, então 


о (4) = (04) 


o (4f = (0%. 
Para ver que (7) é verdadeiro, observe que œ є ((Un>1 An) se, e somente se, 
w É A, para qualquer n, isto é, w € A5, para todo n>1, ou equivalentemente 
c € (, An . Para estabelecer (8) aplicamos (7) a (47) , obtendo 


(U 4) = n4. 
e tomando o complemento vemos ais " 
у= (04): 
Uma relação útil que decorre de (7) е (3) é 
(9) P(U 4) -1- »(n«4). 


Mas |J, 4, é o evento de que pelo menos um dos eventos А, ocorre, enquanto 
(n 4n é о evento de que nenhum desses eventos ocorre. Em palavras, (9) afirma 
que a probabilidade de que pelo menos um dos eventos А, ocorra é 1 menos 
a probabilidade de que nenhum dos eventos 4, ocorra. A vantagem de (9) é 
que em algumas situações é mais fácil determinar P((), 45) do que PII]. А,). 
[Note que desde que os eventos 4, não são necessariamente disjuntos, não é verda- 
deiro que P((J, An) = У, Р(4,). ] O exemplo a seguir ilustra com propriedade 
o uso da expressão (9). 
Exemplo 3. Suponha que se lance três moedas idênticas e perfeitamente equilibradas. 
Determine a probabilidade de obter pelo menos uma cara. 

Representando cara por H e coroa por T, existem .oito resultados possíveis 
para este experimento 


MOEDA 1 H H H H T JE T E 
MOEDA 2 H 
MOEDA 3 H B H т H T H T 


У 
У 
m 
тг! 
У 
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A intuição sugere que cada um desses resultados deve ter a probabilidade de 
ocorrência 1/8. Seja А, о evento de que a primeira moeda apresenta cara, 4, 
o evento de que a segunda moeda apresenta cara e Аз о evento de que a terceira 
moeda apresenta cara. O problema pede a determinação de P(A, U 4; U A3). 
Porém AS 145 045 = { T, T, T) eassim 

Р(А n A$ С А5) = 1/8; 
portanto (9) implica que 
P(A, VA, ЈАз) = 1 - PA n Ag n AS) = 7/8. 

O postulado básico (iii) sobre medidas de probabilidade diz-nos que 
P(A U B) = P(A) + P(B), para conjuntos diguntos А е B. Se А e B não são 
necessariamente disjuntos, então 
(10) P(A U B) = P(A) + P(B) — P(A NB) 

e conseqüentemente 
(11) P(A U B) < P(A) + P(B). 

Para ver que (10) é verdadeiro, observe que os conjuntos А N ВС, A N B, 
АС AB são mutuamente disjuntos e sua união é simplesmente А U B (ver Figura 2). 
Assim 
(12) P(A U B) = P(A N B9) + Р(АС n B) + P(An B). 

Entretanto, em virtude de (2) 
P(A A B£) = P(A) - P(A A B) 


Р(А© N B) = P(B) — P(A A B). 
Substituindo essas expressões em (12), obtemos (10). 


А В 


АПВ 


Figura 2 


As expressões (10) e (11) estendem-se para qualquer número finito de con- 1 
juntos. О análogo da fórmula exata (10) é um tanto complicado e será discutido 
no Capítulo 2. Entretanto, a desigualdade (11) pode ser estendida facilmente 


por indução, obtendo-se 
(13) PA COE 04) < P4) 


i=1 
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Para demonstrá-lo, observe que se п 22, então por (11) 


PRA, 9 90 А) EPA Oy A i A) 
< PA os AL) + P(A): 

Portanto se (13) é verdadeiro para п — 1 conjuntos, também o é para п 
conjuntos. Já que (13) é claramente verdadeiro para п = 1, o resultado fica de- 
monstrado por indução. 

Até aqui usamos o fato de que uma medida de probabilidade é finitamente 
aditiva. O resultado seguinte usa a aditividade enumerável. 


Teorema 1. Sejam os eventos 4,,n > 1. 


() Se4, c А, c: eA = Uri A, entio 


(14) я. lim P(A, = P(A). 
(0) Se 4, > 4, 2: e А = (NA, então (14) se verifica também. 
Demonstração de (i). Suponha que А; СА, С... eA = Ur-i14,. 


Seja B, = А, e paratodo n > 2, seja В, o conjunto de pontos que estão em Ap 
mas não em An. 1, isto 6, B, = An NAj- 1. Um ponto w estáem B, see 
somente se, w estáem А e 4, é o primeiro conjunto da sequência 4,,4,,... 
que contém w. Por definição os conjuntos B, são disjuntos, 


A, = Ü В, 
Р i=1 
i= Ов 
Conseqüentemente а 
PA) = Y P(B) 
e 
P(A) = Y P(B). 
Mas 
(15) lim X P(B) = È P(B) 


no i=1 i=1 


de acordo com a definição da soma de uma série infinita. De (15), segue-se que 


lim P(A,) = lim y P(B,) 


пә o no i=1 


È PB) = PA, 


de modo que (14) é verdadeiro. 


Demonstração de (ii). Suponha qe 4,D4,D.-.e А = (2, А, . 
Então 41 C AS С... eem virtude de (8) 
А = \) 4 


Assim pelo item (i) do teorema 


(16) lim P(AS) = P(A^) 


n- oo 


Como P(AS)=1 — P(A4) e P(A*) = 1 — P(A), segue-se de (16) que 


lim P(A) = lim (1 — P(A2) 
= 1 — lim P(A:) 


Il 


1 — Р(А%) = P(A), 


e novamente (14) se verifica. 


1.4. PROBABILIDADE CONDICIONAL 


Considere uma caixa contendo r bolas vermelhas numeradas de la r e b 
bolas pretas numeradas de 1 a b. Suponha que a probabilidade de extrair qualquer 
bola é (b + r)'!. Se sabemos que a bola extraída é vermelha, qual a probabilidade 
de que seu número seja 1? Outra maneira de formular este problema é como segue. 
Seja 4 o evento de que a bola selecionada é vermelha e seja B o evento de que o 
número da bola selecionada é um. O problema então é determinar a probabilidade 
do evento B tcr ocorrido, dado que ocorreu o evento А. Este problema não pode 
ser resolvido sem ter uma definição precisa da probabilidade condicional de um 
evento, dado um outro evento. Esta definição é a seguinte: 


Definição 3. Sejam dois eventos А e B tais que Р(А) > 0. Então define-se 
a probabilidade condicional de B dado A, representada por P(B | 4), como 
sendo 
(17) "ups 
P(A) 
Se P(A) — 0, a probabilidade de B dado A é indefinido. 
A definição acima pode ser facilmente motivada pela interpretação de pro- j 
babilidades como freqüências relativas. Considere um experimento que é repetitivo 
um grande número de vezes. Sejam N4(A4), М„(В) е М„(А N B) o número 
de vezes que os eventos A, В е А П B ocorrem em n repetições do experimento. 
Se registrássemos somente os experimentos em que А «ocorre, teríamos 4(A) 


E HUN 


a 


provas nas quais B ocorre №,„(А N B) vezes. Assim, a proporção de vezes que 
B ocorre nestes N,(A) experimentos é N (4 N B)/Np (А). Mas 


МА ^ B) МА о B)/n 


М4) N,(A)In 


е assim para valores grandes de n esta fração deve estar próxima de P(A N B)/P(A). 

Como primeiro exemplo do uso de (17) resolvemos o problema proposto 
no começo desta seção. Já que Q contém b +” pontos, cada um com probabi- 
lidade (b + r)'' vemos que Р(А) —r(b tr)! e P(A г B) = (b tr) !. Assim 


PQBI4)- —. 
r 

Esta probabilidade deve ser comparada com a probabilidade “incondicional” 
de B que é P(B) = Xb +r). 
Exemplo 4. Considere o lançamento de duas moedas idênticas e perfeitamente 
equilibradas. 


(а) Determine a probabilidade condicional de obter duas caras, dado que se obteve 
cara na primeira moeda. 

(b) Determine a probabilidade condicional de obter duas caras, dado que se obteve 
pelo menos uma cara. 


Para resolver estes problemas, tomamos o espaço de amostra Q consistindo 
de quatro pontos HH, HT, TH, TT, cada um com probabilidade 1/4. Seja А 
o evento de obter cara na primeira moeda e B o de obter cara na segunda. Para 
resolver (a) determinamos 


P(A AB | A) = Р(А A В)/Р(А) = (1/4)/2) = 1/2. 
Para resolver (b) determinamos 
P(A AN B | A UB) = P(A A В)/Р(А U B) = (1/4/(3/4) = 1/3. 
Nos exemplos acima, o espaço de probabilidade era especificado e usamos 
(17) para determinar diversas probabilidades condicionais. Entretanto, em muitos 
problemas procedemos realmente na direção oposta. Partindo do conhecimento 
antecipado de valores que algumas probabilidades condicionais devem assumir, 


usamos essa informação para determinar a medida de probabilidade ет ©. Apre- 
sentamos a seguir um exemplo típico dessa situação. 


Exemplo 5. Suponha que a população de uma certa cidade é constituída por 40% 
de homens e 60% de mulheres. Suponha ainda que 50% dos homens e 30% das 
mulheres são fumantes. Determine a probabilidade de que uma pessoa que fuma 
seja homem. 

Representamos por M o evento de que a pessoa selecionada é homem e 
por F o evento de que a pessoa selecionada é mulher. Seja S o evento de que a 


pessoa selecionada é fumante e por N о de que a pessoa não é fumante. Então os 
dados do problema são: P(S | M) = 0,5; P(S | F) = 0,3;P(M) = 04 e Р(Е) = 0,6. 
O problema consiste em determinar P(M | S). De acordo сот (17). 
P(M ns). 

RS) ' 
Mas P(M 0 S) = P(M) P(S|M) = (0,4 (0,5) =.0,20, de modo que o numerador 
pode ser determinado em termos de probabilidades conhecidas. Como 5$ é a união 
de dois conjuntos disuntos SAM e SNF, segue-se que 


P(S) =PSNM+P(SNF) 


Р(М | S) = 


Já que 
P(S A F) = Р(Е) P(S | F) = (0,6)(0,3) = 0,18, 
Vemos que 
P(S) — 0,20 * 0,18 — 0,38 
Assim 
Р(М |5) = ee = aa 


O leitor observará que o espaço de probabilidade nunca foi mencionado expli- 
citamente como tal. Resolve-se este problema e outros de natureza similar usando 
a informação dada e as regras para determinar probabilidades dadas na Seção 3 para 
obter as probabilidades desejadas. 

É bastante fácil construir um espaço de probabilidade para o exemplo acima. 
Toma-se para Q o conjunto formado de quatro pontos SM, SF, NM e NF que 
são os únicos pontos nos conjuntos S 0M, SAF, NAM е NAF, respectiva- 
mente. As probabilidades associadas a esses pontos não são especificadas direta- 
mente, mas precisam ser determinadas de tal forma que os eventos (5 | M), (S | F), 
M е F tenham as probabilidades especificadas. Já determinamos P(S NM) = 0,20 
e P(S П F) = 0,18. Deixamos como exercício a determinação das probabilidades 
associadas aos outros dois pontos. 

O problema discutido neste exemplo é um caso especial da situação geral 
que passamos a considerar. Suponha que 4,,4,,...,An são n conjuntos mutua- 
mente disjuntos cuja união é О. Seja B em evento tal que P(B) > 0 e suponha 
que P(B | Ак) e Р(Ак) são conhecidas para 1 < К < n. Qual é o valor de 
Р(А; | В)? Para resolver este problema, observe que Ар são conjuntos disjuntos 
cuja união é Q, de modo que 


B-Bo(Ü 4) = 0 вел) 


Assim 


Mas 
P(B N Ag) = Р(Ак) Р(В | Ag) 
de modo que podemos escrever 
Р(А; е В) __  P(ADPB |4) — 
PB) Dis P(ADP(B | A) 


(18) P(A;| B) = 


Esta fórmula, chamada regra de Bayes, tem aplicação freqüente. Uma forma 
de interpretar o resultado (18) é a seguinte: Suponha que pensemos nos eventos 
Ак como as possíveis “causas” do evento observável B. Então P(A; |B) é a 
probabilidade de que o evento 4; foi a causa de B, dado que B ocorreu. 
A regra de Bayes também forma a base de um método estatístico chamado método 
Bayesiano que será discutido no Volume II, Introdução à Teoria Estatística. 

Como ilustração da regra de Bayes, consideramos o problema seguinte (já 
meio clássico). 


Exemplo 6. Suponha que existam três cofres, cada um com duas gavetas. O pri- 
meiro tem uma moeda de ouro em cada gaveta, o segundo tem uma moeda de ouro 
em uma gaveta e uma moeda de prata em outra, e o terceiro cofre tem uma moeda 
de prata em cada gaveta. Escolhe-se um cofre ao acaso e abre-se uma gaveta. Se a 
gaveta contém uma moeda de ouro, qual a probabilidade de que a outra gaveta 
contenha também uma moeda de ouro? Pedimos ao leitor que faça uma pausa 
e adivinhe a resposta antes de ler a solução. Frequentemente a resposta errada 
de 1/2 é dada para este problema. 

Resolve-se o problema fácil e corretamente usando a regra de Bayes uma 
vez decifrada a descrição. Podemos pensar em um espaço de probabilidade em que 
os eventos Á, 4 e Аз correspondem às seleções do primeiro, segundo e ter- 
ceiro cofre, respectivamente. Estes eventos são disjuntos e sua união é Q, já que 
se seleciona exatamente um cofre. Além do mais, presume-se que os três cofres 
são igualmente prováveis de serem selecionados, de modo que P(A;) = 1/3, 
i — 1, 2, 3. Seja В o evento de que a moeda observada é de ouro. Então, da com- 
posição dos cofres é claro que 


P(B|A,) =1, Р(В | A5) = 1/2 е P(B|A3) = 0 


O problema pede a probabilidade de que a segunda gaveta contenha uma moeda 
de ouro, dado que havia uma moeda de ouro na primeira. Isto pode acontecer 
somente se o cofre escolhido foi o primeiro, assim o problema equivale ao de deter- 
minar P(A, | B). Agora podemos aplicar a regra de Bayes (18) para obter a resposta 
que é 2/3. Deixamos ao leitor como exercício a determinação de probabilidade 
de que a segunda gaveta contenha uma moeda de prata, dado que a primeira continha 
uma de ouro. 

Para exemplo seguinte consideramos um esquema simples de probabilidade 
devido a Polya. 


Exemplo 7. Esquema de urna de Polya. Suponha que uma urna contenha r bolas 
vermelhas e b bolas pretas. Extrai-se uma bola e observa-se a sua cor. A seguir 
coloca-se na urna a bola extraída juntamente com c > 0 bolas da mesma cor. 
Este procedimento é repetido (n — 1) vezes.mais, de modo que o nümero total 
de extrações é n. 


Seja Ку, 1 <j < n, o evento de que a j-ésima bola selecionada é vermelha 
e seja B;, 1 &j <и, o evento de que a j-ésima bola selecionada é preta. Natural- 
mente Ку e Bj são disjuntos para um dado j. No momento da k-ésima extração 
existem b * r + (k — 1)c bolas na urna e assumimos que a probabilidade de sele- 
cionar qualquer bola particular é (b +r + (К — 1)c) ! . Para determinar P(R, N R2) 
escrevemos 


+ 
P(R, N R5) 2 P(R1) P(R5 | R4). 
Mas 
n FELD 
RR) = ; Р(К„ | R) = Ee 
(Rs) b+r (Ro | R$) b+r+c 
e assim 
r ГЕС 
PIR O R) = > 
(К, 2 а 
De forma similar : 
er 
P(B к= 
чы) i b+r+e 
e assim 
РСК) = Р(К, O К») + Р(В, а R5) = 


бт prem: 


рд r 
bur 


Conseqüentemente P(R,) = P(R,). Já que 


b 
Р(В,) = 1 — MR) = ——, 
b+r 
temos P(B,) = P(B,). Propriedades adicionais do esquema de Polya serão de- 
senvolvidas nos exercícios. 


1.5. INDEPENDÊNCIA 


Considere uma caixa contendo quatro bolas distintas e um experimento que 

consiste em extrair uma bola da caixa. Assumimos que a extração de qualquer bola 

é igualmente provável. Seja Q = 1 1, 2,3,4 | , cada ponto com probabilidade 1/4. 
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Sejam dois eventos А e B. Para certas escolhas de А е B, o conhecimento 
de que A ocorre, aumenta a chance de В ocorrer. Porexemplo,se А —|1,2je 
B —|1], então P(A) = 1/2, Р(В) = 1/4 e P(ANB)= 1/4. Conseqüentemente 
P(B | A) = 1/2, que é maior que P(B). Por outro lado, para outras escolhas de А 
e B, o conhecimento de que А ocorre, diminui a chance de В ocorrer. Por exem- 
plo: se А = {1,2,3}, В = {1,2,4}, então P(A) = 3/4, P(B) = 3/4 e 
P(A NB) = 1/2. Portanto P(B | A) = 2/3 que é menor que P(B). 

Um caso muito interessante ocorre quando o conhecimento de que А ocorre 
não altera a chance de ocorrência de B. Como um exemplo disso, seja А = {1,2} 
e B=(1,3; então P(A) = 1/2, P(B) = 1/2 e Р(А ПВ) = 1/4, e portanto 
Р(В | А) = 1/2. Eventos como esses, para os quais as probabilidades condicional 
e incondicional são iguais, são chamados eventos independentes. 

Sejam 4 e B dois eventos quaisquer em um espaço geral de probabilidade, 
e suponha que P(A) + 0. Podemos definir os eventos А e В como sendo inde- 
pendentes se P(B|A) = P(B). Como P(B|A) = P(B п AyP(A), vemos que 
se 4 e B são independentes, então 


(19) P(A AN B) = P(A) P(B). 
Como (19) faz sentido mesmo que P(4) = 0 e é também simétrica em А 
e B, ela conduz a uma definição alternativa de independência. 
Definição 4. Dois eventos А e B são independentes se e somente se, 
| Р(А A B) = P(A) P(B). 


Podemos considerar um problema semelhante para trés conjuntos A, B 
e C. Seja Q ={ 1, 2,3,4 }, cada ponto com probabilidade 1/4. Seja A = (1,2), 
B= (1, 3Je C={1, 4). Deixamos como exercício, mostrar que os pares de 
eventos А е B, A e C e B e C são independentes. Dizemos que os eventos 
А,В e C são independentes aos pares. Por outro lado, P(C) = 1/2 e 


P(C|AnB)- 1. 


Assim, o conhecimento de que o evento А N B ocorre, aumenta a chance de C 
ocorrer. Neste sentido os eventos А,В e C não chegam a ser mutuamente inde- 
pendentes. Em geral três eventos А, B e C são mutuamente independentes se 
são independentes aos pares e se 


P(A A B AC) = P(A) P(B) P(C). 
Como exercício, mostre que se 4, B e C são mutuamente independentes e 
P(A AN B) = 0, então P(C |A В) = Р(С). 
De um modo geral, definimos n > 3 eventos 4,, Á2,...,An como sendo 


mutuamente independentes se 


PANA П... An) =P(41) P42): - P(Aq) 


e se qualquer subcoleção contendo pelo menos dois porézm memos gue m cun 
são mutuamente independentes. 


Exemplo 8. Seja 5 o quadrado no plano O& x &« 1 e OX » < 1 Comes o 
espaço uniforme de probabilidade sobre o quadrado, e seja 4 o vento. 
Кени << ТОЕ Тра 
е B oevento a 
1): 0s x ISO Ty ж АК X 

Note que А e В são eventos independentes. 

Para tanto, determinamos P(A), P(B) e HA N B) e mostramos que 
P(A N В) = P(A) P(B). Como A é um sub-retângulo do quadrado S com área 
1/2 e В é um sub-retângulo de 5 com área 1/4, segue-se que Р(А) = 1/2 e E 
P(B) — 1/4. Por outro lado 

ANB= (x,)):0<x<1/2,0<y< 1/4 | 

é um sub-retángulo do quadrado S com área 1/8. Assim P(A B) = 1/8 e vemos 
que А e В são eventos independentes. 

Usa-se frequentemente a noção de independência para construir espaços de 
probabilidades correspondentes a repetições de um mesmo experimento. Daremos 
um tratamento mais completo a esse assunto no Capítulo 3. Aqui nos contentaremos 
em examinar a situação mais simples, aquela que envolve experimentos (como o 
lançamento de uma moeda possivelmente não tendenciosa) que podem conduzir 
a apenas um dos dois resultados possíveis — sucesso ou fracasso. 

Em um experimento com п lançamentos de uma moeda, onde sucesso е 
fracasso em cada lançamento ocorrem com probabilidades p e 1 — p, respectiva- 
mente, acreditamos intuitivamente que o resultado do i-ésimo lançamento não 
deve ter influência alguma sobre os resultados dos outros lançamentos. Desejamos 
agora construir um espaço de probabilidade para o experimento composto, consistindo 
de n repetições do nosso experimento, que incorpore as nossas crenças intuitivas. 

Já que cada uma das n repetições pode resultar em sucesso ou fracasso, 
existem um total de 2" resultados possíveis para o experimento composto. Pode-se 
representar esses resultados através de uma n-tupla (Xx,,x2,...,Xn), onde х; = 1 
se a i-ésima repetição resulta em sucesso e x; = O caso contrário. Tomamos o 
conjunto (2 como sendo a coleção. de todas as n-tuplas como esta. Toma-se o 4 
o-álgebra 7 como sendo constituído de todos os subconjuntos de Q. 


Y 


Chegamos agora à alocação de uma medida de probabilidade. Para isso é 
necessário tão somente alccar probabilidades a 2" conjuntos de um ponto 
f(x1,X2,...,Xn)|. Suponha que a n-tupla (x,,...,Xn) é tal que exatamente 
k dos x; tem o valor 1, por simplicidade, digamos que x; = x; =. = хр = 1 é 
e os outros x; tenham o valor 0. Então se 4; representa o evento de que a i-ésima i 
repetição resulta em sucesso, vemos que 


СОЗ be Dj Aa SAR AR а у А, 
——————— 


k n—k 


De acordo com nossa intuição, os eventos 41,45, ..., Ag, Apu... Ag devem 
ser mutuamente independentes e P(Aj) = p, 1 <і «n. Assim devemos escolher 
P de tal forma que 


PL 1.21, 5,.....09) 


P(A1): *: P(A)P(At 1) oo PCAD) 

PO c^. 

Usando o mesmo raciocínio, vemos que se a n-tupla (x1,..., x4) é tal que exa- 
tamente k dos x; tem o valor 1, P deve ser tal que 


Р({(х1,..., х))) = p — pr 


il 


Determinemos a seguir a probabilidade de que exatamente k das n repetições 
resultem em sucesso. Observe, cuidadosamente, que isto difere da probabilidade 
de que exatamente k repetições específicas, resultem em sucesso e que, as outras 
n — k repetições, resultem em fracasso. Seja By o evento de que se obtém sucessos 
em exatamente k das n repetições. Uma vez que cada seqüência específica com k 
sucessos têm probabilidade pk(1 — р)п-К, o evento Вк tem probabilidade 
P(By) = C(k, n)pk(1 — р)п-К, onde C(k,n) é o número de seqüéncias 
(X1, ...,xg) nas quais exatamente k dos x; tem valor 1. A determinação de 
C(k,n) é um problema combinatório simples que será resolvido na Seção 2.4, onde 
mostraremos que 


n! 


20 Gr) = = кы слі n 
(20) Дай TA 2 


Lembre-se que 0! — 1 e que 
m! = пт — Dl. 


para qualquer número inteiro positivo т. Geralmente representa-se a quantidade 


n!/k! (n — k)! por ( е ) (coeficiente binomial). Assim 


(21) Р(В,) = (а) p — prt, 


Diversos problemas aplicados são modelados por provas independentes do tipo 
sucesso-fracasso. O problema discutido a seguir é típico. 


Exemplo 9. Suponha que uma máquina produza parafusos dos quais 10% são de- 
feituosos. Determine a probabilidade de que uma caixa com 3 parafusos contenha 
no máximo um parafuso defeituoso. 

Para resolver o problema, supomos que a produção de parafusos constitui 
repetições independentes de uma prova do tipo sucesso-fracasso em que a produção 
de um parafuso defeituoso é um sucesso. Então a probabilidade de sucesso neste 
caso é 0,1. Seja Bo о evento de que nenhum dos três parafusos é defeituoso e 
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B, o de que exatamente um dos trés parafusos é defeituoso. Então B, U B, 
é o evento de que no máximo 1 parafuso é defeituoso. Como B, e B, são eventos 
disjuntos, segue-se que 


P(Bg U B,) = P(Bg) + P(B1) = 


- (5) (0,1)? (0,9)? — б | (0.1)1(0.9)* = : 
= (0.9? + 3(0,1)(0,9)° = 
= 0,972. 


Exercícios 


1. Seja (Q, £ ,P) um espaço de probabilidade, onde „7 ё o-álgebra de todos 
os subconjuntos de Q e P, uma medida de probabilidade que associa а pro- 
babilidade р > O cada conjunto de um ponto de Q. 


(a) Mostre que 9, deve ter um número finito de pontos. Sugestão: mostre 
que (2 não pode ter mais de р! pontos. 

(b) Mostre que se n é o número de pontos em ©, então p deve ser igual 
aus 

2. Pode-se construir um modelo para um "spinner" aleatório tomando um espaço 
uniforme de probabilidade sobre a circunferéncia de um círculo de raio 1, 
de modo que a probabilidade de que o ponteiro do "spinner" pare sobre um 
arco de comprimento s é s/2m. Suponha que o círculo esteja dividido em 37 
zonas numeradas de 1 a 37. Determine a probabilidade de que o ponteiro 
pare sobre uma zona par. 

3. Considere um ponto escolhido ao acaso sobre um quadrado unitário. Determine 
a probabilidade de que o ponto esteja no triângulo limitado por х = 0, y —0 
exty-l. 

4. Seja P um ponto escolhido ao acaso sobre um disco unitário. Determine 
a probabilidade de que Р esteja no setor angular de 0 а 7/4 radianos. ' 


5. No Exemplo 2 determine as probabilidades dos seguintes eventos: 


(a) Nenhuma desintegração ocorre antes do tempo 10. 
(b) Ocorre uma desintegração antes do tempo 2 ou uma entre os tempos 3 e 5. 


6. Uma caixa contém 10 bolas numeradas de 1 a 10. Extrai-se ao acaso uma 
bola da caixa. Determine a probabilidade de que o número da bola seja 3, 4 ou 5. 


7. Suponha que se lance um par de dados e que os 36 resultados possíveis são 
igualmente prováveis. Determine a probabilidade de que a soma dos números 
observados seja par. 
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13. 


14. 


15. 


16. 


17. 


18. 


- Suponha que А e В sejam eventos tais que P(4) = 2/5, P(B) = 2/5 е 
P(A ОВ) = 1/2. Determine P(A N B). 
. Se P(A) = 1/3, P(A U B) = 1/2, e P(A A B) = 1/4, determine P(B). 


10. Suponha que se escolha ao acaso um ponto sobre um quadrado unitário. Seja 4 


o 


evento de que o ponto está no triángulo limitado por y = 0, x 1e x—y, 
е B o evento de que o ponto está no retângulo com vértices em (0,0), (1, 0), 
(1, 1/2) e (0, 1/2). Determine P(A U B) e P(ANB). 


. Uma caixa contém 10 bolas numeradas de 1 a 10. Seleciona-se uma bola ao 


acaso e a seguir seleciona-se, também ao acaso, uma segunda bola dentre as 
9 restantes. Determine a probabilidade de que os nümeros das bolas selecionadas 
diferem de duas ou mais unidades. 


. Dado que um ponto escolhido ao acaso sobre um quadrado unitário esteja no 


triângulo limitado por x = 0, у= 0 e x+y = 1, determine a probabilidade 
de que o mesmo esteja também no triângulo limitado por y = 0,x —1 e x = y. 
Suponha que temos quatro cofres, cada um com 2 gavetas. Os cofres 1 e 2, 
tém uma moeda de ouro em uma gaveta e uma de prata na outra. O cofre 
3, tem duas moedas de ouro e, o cofre 4 tem duas de prata. Escolhe-se um 
cofre ao acaso, abre-se uma gaveta e encontra-se uma moeda de ouro. Determine 
a probabilidade de que a outra gaveta contenha 

(a) uma moeda de prata; 

(b) uma moeda de ouro. 


Uma caixa contém 10 bolas das quais 6 são pretas e 4 são brancas. Remove-se 
três bolas sem observar suas cores. Determine a probabilidade de que uma 
quarta bola removida da caixa seja branca. Assuma que as 10 bolas são igual- 
mente prováveis de serem removidas da caixa. 


Para uma caixa de mesma composição que a do Exercício 14, determine a 
probabilidade de que todas as 3 bolas removidas sejam pretas, sabendo-se que 
pelo menos uma delas é preta. 

Suponha que uma fábrica tem duas máquinas 4 e B, responsáveis, respecti- 
vamente, por 60% e 40% da produção total. A máquina 4 produz 3% de itens 
defeituosos, enquanto que a máquina B produz 5% de itens defeituosos. Determi- 
ne a probabilidade de que um dado item defeituoso foi produzido pela máquina B. 


Mostre por indução sobre n que a probabilidade de selecionar uma bola ver- 
melha na n-ésima extração no esquema de Polya (Exemplo 7) é r(b + r)'!. 
para qualquer n. 
Um estudante se submete a um exame de múltipla escolha no qual cada questão 
tem 5 respostas possíveis das quais exatamente uma é correta. O estudante 
seleciona a resposta correta se ele sabe a resposta. Caso contrário, ele seleciona 
ao acaso uma resposta entre as 5 possíveis. Suponha que o estudante saiba a 
resposta de 70% das questões. 
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23, 
24. 


25. 


26. 


(3) Qual a probabilidade de que o estudante escolha a resposta correta para 
uma dada questão? 

(b) Se o estudante escolhe a resposta correta para uma dada questão, qual 
a probabilidade de que ele sabia a resposta? 

Suponha que se escolha ao acaso um ponto sobre um quadrado unitário. Saben- 

do-se que o ponto está no retângulo limitado por y = 0, у = 1, x =0, e 

x = 1/2, qual é a probabilidade de que o ponto esteja no triângulo limitado 

por y=0,x=1/2exty=1? 

Suponha que uma caixa contenha r bolas vermelhas e b bolas pretas. Extrai-se 

ao acaso uma bola da caixa e a seguir extrai-se, também ao acaso, uma segunda 

bola dentre as que ficaram na caixa. Determine a probabilidade de que 

(a) ambas as bolas sejam vermelhas; 

(b) a primeira bola seja vermelha e a segunda preta; 

(c) a primeira bola seja preta e a segunda vermelha; 

(d) ambas as bolas sejam pretas. 

Uma caixa contém 10 bolas vermelhas e 5 pretas. Extrai-se uma bola da caixa. 

Se a bola é vermelha, ela é recolocada na caixa. Se é preta, além de recolocá-la 

na caixa, adiciona-se duas bolas à caixa. Determine a probabilidade de que uma 

segunda bola extraída da caixa seja 

(a) vermelha; (b) preta. 

Extrai-se duas bolas, com reposição da primeira, de uma caixa contendo 3 bolas 

brancas e 2 bolas pretas. 

(a) Construa um espaço de amostra com pontos igualmente prováveis para 
este experimento. 

(b) Determine a probabilidade de que as bolas extraídas sejam da mesma cor. 


(с) Determine a probabilidade de que, pelo menos, шпа das bolas extraídas 


seja branca. 
Resolva o Exercício 22, caso a primeira bola não seja reposta na caixa. 
Resolva o Exercício 22, construindo um espaço de amostra baseado em 4 pontos 
correspondendo a bola branca e bola preta para cada extração. 
Caixa I contém.3 bolas brancas e 2 pretas, caixa II contém 2 bolas brancas 
e 1 preta e caixa III contém 1 bola branca e 3 pretas. 


(a) Extrai-se uma bola de cada caixa. Determine a probabilidade de que todas 
as bolas sejam brancas. 

(b) Seleciona-se uma caixa e dela extrai-se uma bola. Determine a probabilidade 
de que a bola extraída seja branca. 

(c) Calcule em (b) a probabilidade de que a primeira caixa foi selecionada, 
dado que a bola extraída é branca. 

Uma caixa contém 3 bolas brancas e 2 bolas pretas. Selecionam-se duas bolas 

sem reposição. 
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36. 


(a) Calcule a probabilidade de que a segunda bola seja preta, dado que a pri- 
meira é preta. 

(b) Calcule a probabilidade de que a segunda bola seja da mesma cor da 
primeira. 

(c) Calcule a probabilidade de que a primeira bola seja bránca, dado que a 
segunda é branca. 


Um colégio é composto de 70% de homens e 30% de mulheres. Sabe-se que 
40% dos homens e 60% das mulheres são fumantes. Qual é a probabilidade 
de que um estudante que foi visto fumando seja homem? 


Suponha que os automóveis têm igual probabilidade de serem produzidos 
na segunda, terça, quarta, quinta e sexta-feira. As porcentagens de automó- 
veis amarelos produzidos nos diferentes dias da semana são: segunda — 4%; 
terça, quarta e quinta — 1%; e sexta — 2%. Se você compra um automóvel 
amarelo, qual a probabilidade de que o mesmo foi produzido numa segunda-feira? 


Suponha que existisse um teste para câncer com a propriedade de que 90% 
das pessoas com câncer e 5% das pessoas sem câncer reagem positivamente. 
Admita que 1% dos pacientes de um hospital tem câncer. Qual a probabilidade 
de que um paciente escolhido ao acaso, que reage positivamente a esse teste, 
realmente tenha câncer? 

No problema de três cofres discutidos no Exemplo 6, determine a probabilidade 
de que a segunda gaveta contenha uma moeda de prata, dado que a primeira 
continha uma moeda de ouro. 

No esquema de urna de Polya (Exemplo 7), dado que a segunda bola é vermelha, 
determine a probabilidade de que 


(a) a primeira bola era vermelha; 
(b) a primeira bola era preta. 


. Suponha que se lança três moedas idênticas e perfeitamente equilibradas. Seja 


A; o evento de observar cara na i-ésima moeda. Mostre que os eventos 
41,45 e Аз são mutuamente independentes. 


Suponha que as seis faces de um dado têm igual probabilidade de ocorrência 
e que sucessivos lançamentos do dado são independentes. Construa um espaço 
de probabilidade para o experimento composto de três lançamentos do dado. 


. Sejam А e B dois eventos independentes. Mostre que А e B^, AC e B 


e А© e Bº são também independentes. 


- Seja Q ={ 1,2,3,4} e suponha que cada ponto tem probabilidade 1/4. 


Sendo 4—11,2], B=[1,3) e C=(1,4), mostre que os pares de eventos 
А e B, А e C e B е С sãoindependentes. 


Suponha que А, B e C são eventos mutuamente independentese P(A NB) = 0. 
Mostre que P(C |A A В) = P(C). 
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41. 


42. 


43. 


44. 


45. 


46. 


47. 


Experiéncia mostra que 20% das pessoas que fazem reservas de mesa num certo 
restaurante deixam de comparecer. Se o restaurante tem 50 mesas e aceita 52 
réservas, qual a probabilidade de que seja capaz de acomodar todos os fregueses? 
Um alvo circular de raio unitário está dividido em quatro zonas anelares com 
raios externos 1/4, 1/2, 3/4 e 1, respectivamente. Suponha que se dispare 
ao alvo 10 tiros independentemente e ao acaso. 
(a) Determine a probabilidade de que no máximo 2 tiros atinjam a zona limi- 
tada pelos círculos de raios 1/2 e 1. 
(b) Se 5 tiros atingem o disco de raio 1/2, determine a probabilidade de que 
pelo menos um atinja o disco de raio 1/4. 
Uma máquina consiste de 4 componentes ligados em paralelo, de tal sorte que a 
máquina falha somente se todos os quatro componentes falham. Suponha que 
as falhas dos componentes sáo independentes umas das outras. Se os compo- 
nentes tem probabilidades 0,1; 0,2; 0,3 e 0,4 de falhar quando a máquina é 
acionada, qual é a probabilidade de que a máquina funcione quando acionada? 
Um certo componente de um motor de foguete falha 5% das vezes quando o 
motor é acionado. Para obter maior confiabilidade no funcionamento do 
motor, duplica-se esse componente n vezes. O motor então falha somente 
se todos os n componentes falham. Suponha que as falhas dos componentes 


sejam independentes uma das outras. Qual é o menor valor de n que pode ser 


usado para garantir que o motor funcione 99% das vezes? 

Lança-se um dado simétrico três vezes. Sabendo-se que a face 1 ocorre pelo 
menos uma vez, qual é a probabilidade de que ela ocorra exatamente uma vez? 
Existem 4 reis num baralho de 52 cartas. Extrai-se uma carta do baralho, 
registra-se o seu valor e a seguir repõe-se a carta extraída. Este procedimento 
é repetido 4 vezes. Determine a probabilidade de que existam exatamente 
2 reis entre as cartas selecionadas, sabendo-se que entre elas existe pelo menos 
um rei. 

Mostre que se А, В e C são eventos tais que PMANBNCO £0 е 
P(C|IANB)=P(C|B), então P(A |B A C) = F(A | B). 

Um homem dispara 12 tiros independentes num alvo. Qual a probabilidade 
de que ele atinja o alvo pelo menos uma vez, se tem probabilidade 9/10 de 
atingir o alvo em qualquer tiro? 

Lança-se um dado 12 vezes. Determine a probabilidade de obter 

(a) dois “seis”; 

(b) no máximo dois “seis”. 

Suponha que a probabilidade de atingir um alvo é 1/4. Disparando-se oito tiros 
ao alvo, qual a probabilidade de que o alvo seja atingido pelo menos duas vezes? 
No Exercício 44 qual a probabilidade de que o alvo seja atingido pelo menos 
duas vezes, sabendo-se que o mesmo foi atingido pelo menos uma vez? 


ANÁLISE COMBINATÓRIA 


Lembre-se da Seção 1.2 onde um espaço simétrico de probabilidade contendo 
s pontos, é o modelo usado para o experimento de selecionar ao acaso um ponto 
de um conjunto 5 contendo s pontos. Daqui para diante, quando falarmos em 
selecionar ao acaso um ponto de um conjunto finito S, estaremos dizendo que, 
a probabilidade associada а cada conjunto de um ponto é s”!, e, portanto, que a 
probabilidade associada a um conjunto А contendo j pontos é j/s. 

Seja N(A) o número de pontos em А. Desde que P(A) = N(A)/s, o problema 
de determinar P(A) é equivalente ao de determinar N(A). О procedimento para 
obter P(A) é contar o número de pontos em 4 e dividir pelo número total s de 
pontos. Entretanto, às vezes inverte-se o procedimento. Se de alguma forma co- 
nhecemos P(A), podemos obter N(A4) pela fórmula N(A) = sP(A). Este proce- 
dimento será usado muitas vezes na seqüéncia. 

A determinação de N(A) é fácil quando А tem apenas alguns pontos, pois 
neste caso podemos, simplesmente enumerar todos os pontos em А. Porém, mesmo 
que А tenha um número moderado de pontos, o método de enumeração direta 


“torna-se impraticável, e assim algumas regras simples de contagem são desejáveis. 


Nosso propósito neste capítulo é apresentar uma discussão não-técnica e sistemática 
de métodos que são elementares porém de grande aplicabilidade. Este assunto 
tende a tornar-se difícil rapidamente, por isso limitaremos nosso tratamento àquelas 
partes maiores na teoria da probabilidade. As primeiras quatro seções deste capítulo 
contêm o material essencial, enquanto as quatro últimas seções contêm um material 
opcional e um pouco mais difícil. 


2.1. AMOSTRAS ORDENADAS 


Suponha que temos dois conjuntos S e T. Se S tem m pontos distintos 
S155. sao Sm е Т tem nº pontos distintos fis fz,- -sins então o número 
de pares (sj, tj) que podem ser formados tomando um ponto do conjunto 5 e um 
segundo ponto do conjunto T é mn. Isto é claro de vez que qualquer elemento 
do conjunto S- pode ser associado a qualquer um dos п elementos do conjunto T. 


Exemplo 1. Se S= {1,2} e T= {1,2,3}, então existem seis pares: (1,1), (1,2), 
(1,3), (2,1), (2,2), (2,3). Observe cuidadosamente que o par (1,2) é distinto do 
par (2,1). 

De forma mais geral, suponha que temos n conjuntos $,,S,,...,S, tendo 
51, $2 --- Sn pontos distintos, respectivamente. Então o número de n-tuplas 
(X1, X2, . - . , Xn) que podem ser formados, onde x, é um elemento de S4, x; 
um elemento de S,,..., e x, um elemento de Sns é 515, -- Sne Isto é uma 
extensão bastante óbvia do caso discutido acima para n = 2. (Uma demonstração 
formal de que o número de n-tuplas é 5,55 - - -Sn pode ser feita por indução sobre n.) 

Um importante caso especial ocorre quando cada conjunto 5;, 1 Si <n, é 
o mesmo conjunto § tendo s pontos distintos. Existem então s" n-tuplas 
(x1,X2,...,Xn), onde cada x; é um ponto do conjunto S. 

Exemplo 2. $={1,2} е n = 3. Neste caso existem 8 n-tuplas: (1, 1, 1), (1, 1, 2), 
(1,2, 1505, 2,245 (0, 0 (062), (0; 2:2. 

O caso especial em que os conjuntos S;, 1 <i <n, são os mesmos, pode ser 
abordado de um ponto de vista diferente. Suponha que uma caixa contém s bolas 
distintas numeradas de 1 a s. Extrai-se uma bola da caixa, registra-se o seu nümero 
e a seguir repõe-se a bola na caixa. Repete-se o procedimento п vezes. Cada uma 
das n extrações produz um número de 1 a s. O resultado pode ser registrado 
através de uma n-tupla. (x1, x,,...,Xn), onde x, é o número da 1а bola, x;, 
o da 22 etc. Existem ao todo s” n-tuplas. Este procedimento chama-se amostragem 
com reposição de uma população de s objetos distintos. O resultado (x,,X2,...,Xn) 
chama-se amostra de tamanho n extraída com reposição de uma população de 
s objetos. Falamos de amostragem aleatória com reposição, se admitirmos que 
todas as s" amostras possíveis têm a mesma probabilidade ou, na linguagem tradi- 
cional, são igualmente prováveis de ocorrer. 

Exemplo 3. Lança-se n vezes uma moeda perfeitamente equilibrada. Determinar 
a probabilidade de obter pelo menos uma cara. 

Presumivelmente a afirmação de que a moeda é perfeitamente equilibrada 
implica que a probabilidade de obter cara em qualquer lançamento é 1/2. Se assim 
for, e se supormos que lançar a moeda n vezes equivale extrair uma amostra alea- 
tória de tamanho п de uma população de dois objetos | Н, Т |, então cada um 
dos 2” resultados possíveis é igualmente provável. Seja 4 o evento de obter pelo 
menos uma cara e 4; o de obter cara no i-ésimo lançamento. Então А = Ut-i A;. 
Mas 


Р(А) = 1 – P(A) = 
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e (Y=: 45 ocorre se e somente se, todos os n lançamentos produzirem coroas. 
Assim P((;-; 49) = 27", de modo que P(A) = 1 = 27". 
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Seja $ um conjunto contendo s objetos distintos. Selecionamos um objeto 
de S e registramos o objeto selecionado, mas suponha agora que não o repomos 
ao conjunto S. Se repetirmos este procedimento, faremos uma seleção dentre 

| (s — 1) objetos restantes. Suponha que o procedimento seja repetido mais n — 1 
vezes, de modo que selecionamos п objetos ао todo. (Obviamente devemos ter 
n < s neste caso). Novamente podemos registrar o resultado em forma de uma 
n-upla (ху, X2, . . . , X4), porém desta vez os números x,,x2,...,Xn devem 
ser distintos, não pode haver duplicações na nossa amostra. O primeiro objeto 
pode ser qualquer um dos s objetos, o segundo pode ser qualquer um dos 5 — 1 
objetos restantes, o terceiro pode ser qualquer um dos s — 2 objetos restantes etc., 
de modo que existem ao todo (s), = s(s — 1) ---(s—n + 1) diferentes resultados 
possíveis para o experimento. Refere-se a este procedimento como amostragem 
sem reposição n de uma população de s objetos distintos. Falamos de uma amostra 
aleatória de tamanho п tomada sem reposição de uma população de s objetos 
se supomos que cada um dos (s), resultados é igualmente provável. 


Representamos o produto s(s — 1) --- (s — и + 1) por meio de símbolo (s),. 
Em particular (s); = s(s — 1)... 1 = s! Mas extrair uma amostra de tamanho s 
de uma população de s objetos diferentes equivale a escrever os números 1, 2,...,$ 


em alguma ordem. Assim s! representa o número de ordenações diferentes (ou 
permutações) de s objetos. 

Suponha que se extraia com reposição uma amostra aleatória de tamanho 
n de um conjunto de s objetos. Desejamos a probabilidade do evento 4 de que 
nenhum ponto ocorre duas vezes na amostra. Este problema pode ser resolvido 
facilmente. O número de amostras de tamanho п com reposição é s". Dentre 
estas s" amostras aleatórias, o número daquelas nas quais nenhum ponto aparece 
duas vezes é igual ao número de amostras de tamanho n extraídas sem reposição 
dentre s objetos, isto é, s". Assim, já que todas as amostras são igualmente pro- 
váveis, vemos que a probabilidade desejada é 
(1) Pu edge Ый. 


n 


S S 


ЕБЕ 


Exemplo 4. Uma aplicação recente e um tanto surpreendente de (1) é no chamado 
problema do aniversário. Suponha que os aniversários das pessoas ocorram com 
igual probabilidade entre os 365 dias do ano. (Ignoramos aqui os anos bissextos 
e o fato de que as taxas de natalidade não são exatamente uniformes ao longo do 
ano). Determinar a probabilidade p de que em um grupo de n pessoas não existam 
duas com aniversários comuns. 


Neste problema temos s = 365, e assim aplicando (1) vemos que 


| кец e лат 


NE 


Аз consequéncias numéricas são bastantes inesperadas. Mesmo рага s tão pequeno 
como 23, р < 1/2,e para п = 56, р = 0,01. Isto é, num grupo de 23 pessoas, 
a probabilidade de que pelo menos duas pessoas tenham o mesmo aniversário ex- 
cede 1/2. Num grupo de 56 pessoas é quase certo que duas pessoas tenham o mesmo 
aniversário. 

Se temos uma população de s objetos, existem s” amostras de tamanho 
n que podem ser extraídas com reposição e (s), amostras de tamanho п que 
podem ser extraídas sem reposição. Se s for grande em relação a n, existe pouca 
diferença entre esses dois métodos de amostragem. Realmente, vemos de (1) que 
para qualquer n fixo. 


(2) jud 508 s dan ( * ) ne ( = z=) = 


„n 
s>co $ s> 00 


(Para estimativas mais precisas ver Exercício 12.) 


2.2. Permutações 


Suponha que temos n caixas distintas e n bolas distintas. O número total 
de maneiras de distribuir as n bolas nas caixas de modo que cada caixa contenha 
exatamente uma bola é n! Dizer que essas bolas são distribuídas ao acaso nas 
n caixas com uma bola por caixa significa que associamos probabilidade 1/n! a cada 
uma dessas distribuições possíveis. Suponha que este seja o caso. Qual é a proba- 
bilidade de que uma bola específica, digamos bola i, esteja numa caixa específica, 
digamos caixa /? бе a bola i está na caixa j, isto deixa (n — 1) bolas para serem 
distribuídas em (n — 1) caixas de modo que exatamente uma bola esteja em cada 
caixa. Isto pode ser feito de (n — 1)! maneiras, de modo que a probabilidade dese- 
jada é (n — D!/n! = 1/и. 

Outra maneira de interpretar este resultado é a seguinte. Se permutamos 
entre si n objetos distintos, a probabilidade de que um objeto específico esteja 
numa posição específica é 1/n. Realmente, aqui podemos identificar as posições 
com as caixas e os objetos com as bolas. 

Pode-se estender facilmente as considerações acima de 1 para k > 1 objeto. 
Se permutamos entre si n objetos, a probabilidade de que k objetos específicos 
estejam em k posições específicas é (n — k)!/n!. Deixamos a demonstração desse 
fato para o leitor. 

Problemas envolvendo permutações aleatórias, tomam uma variedade de formas 
quando enunciados literalmente. Apresentamos a seguir dois exemplos: 


(a) Mistura-se um baralho de cartas numeradas de 1 a п e extrai-se as cartas 
uma a uma. Para um dado i, qual é a probabilidade de que a i-ésima 
carta extraída é a de número i? 
(b) Suponha que dez casais comparecem a uma festa. Então forma-se ao 
acaso pares de rapazes e moças. Qual é a probabilidade de que exatamente 
k rapazes específicos fiquem com as respectivas namoradas? 
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Um problema mais sofisticado envolvendo permutações aleatórias, é o de 
determinar a probabilidade de que ocorram exatamente k “encontros”. Para usar 
o nosso exemplo visual de distribuir bolas em caixas, o problema é determinar a 
probabilidade de que a bola i esteja na caixa i para exatamente k valores 
diferentes de i. 


Pode-se resolver o problema do encontro de várias maneiras. Adiamos a 
discussão deste problema para a Seção 2.6. 


2.3. Combinações (amostras desordenadas) 


Uma mão de pôquer consiste de cinco cartas extraídas de um baralho de 52 
cartas. De acordo com a discussão acima, existiriam (52); mãos de pôquer. 
Entretanto, para chegar a esta contagem diferentes ordenações das mesmas cinco 
cartas são consideradas mãos diferentes. Isto é, a mão 2, 3, 4, 5, 6 de espadas nesta 
ordem é considerada diferente da mão 2, 4, 3, 5, 6 de espadas nesta ordem. Do ponto 
de vista do jogo, estas mãos são as mesmas. De fato, todas as 5! permutações das 
mesmas cinco cartas são equivalentes. Das (52); mãos possíveis, exatamente 5! 
delas são simplesmente permutações dessas mesmas cinco cartas. Similarmente, 
para qualquer conjunto de cinco cartas existem 5! diferentes permutações. Assim, 
o número total de mãos de pôquer, sem considerar a ordem em que as cartas apa- 
recem, é (52)s/5! Nesta contagem considera-se duas mãos diferentes se, e somente 
se, elas diferem como conjunto de objetos, isto é, se elas têm pelo menos um ele- 
mento diferente. Por exemplo, entre as (52)s/5! mãos de pôquer, as mãos (2, 3, 
4, 5, 6) de espadas e (3, 2, 4, 5, 6) de espadas são as mesmas, porém as mãos (2, 3,4, 
5, 7) de espadas e (2, 3, 4,5, 6) de espadas são diferentes. 


| De uma forma mais geral, suponha que temos um conjunto 5 de s objetos 
distintos. Então, como foi explicado anteriormente, existem (s), amostras distintas 
de tamanho r que podem ser extraídas sem reposição de S. Cada subconjunto 
distinto { x4, .., Xp | de r objetos de S pode ser ordenado (rearranjado) de r! 
maneiras diferentes. Se decidimos ignorar a ordem em que os objetos aparecem na 
amostra, essas r! reordenações de x,,...,x, serão consideradas as mesmas. Existem 
portanto, (s)/r! diferentes amostras de tamanho r que podem ser extraídas, sem 
reposição e sem consideração de ordem, de um conjunto de s objetos distintos. 


Geralmente representa-se a quantidade (s),/r! por meio do símbolo do coe- 


| 
ficiente binomial 
(5), _ (s 
pi^ npe 
Observe que para r = 0, 1, 2,..., 5 


(5) mo s! 
Д r! r!(s — r)! 
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Indicamos aqui para uso futuro que ( » é bem definido para qualquer número 


real а e qualquer número inteiro não-negativo r através de 


(jo Gr se Dee een 


(3) 


r r! r! 


onde 0! e (а), são ambos definidos como sendo 1. 


Exemplo S. 


cH). а а) л?) 
3 3! 
2 о, 
== со DE 
Observe que se a é um número inteiro positivo, então (7 )= 0 para r>a. 
Convencionamos que (7) = 0 se r é um número inteiro negativo. Então (5) 
é definido para todo real а e todo inteiro r. 


Como foi observado anteriormente, quando s é um inteiro positivo e r 
é um inteiro não-negativo, é interessante pensar em ( a ) como o número de ma- 


neiras em que podemos extrair sem reposição uma amostra de tamanho r- de uma 
população de s objetos distintos sem consideração da ordem em que esses objetos 
são escolhidos. 


Exemplo 6. Considere o conjunto de números ИШ ул. nao зс 
] €r €n, existem exatamente (2) escolhas de números i,,i,,...,i, tais que 
I<i<i)<---<i,<n. Realmente, cada uma das (n), escolhas de r números 


distintos de 1 a п tem r! reordenações das quais exatamente uma satisfaz a condi- 
ção desejada. Assim, o número de escolhas distintas de números que satisfazem 
a condição é igual ao número de distintos subconjuntos de tamanho r que se pode 


extrair do conjunto (1,2,...,n). 


Exemplo 7. Membros de comissão. O departamento de matemática consiste de 
25 professores titulares, 15 professores adjuntos e 35 professores assistentes. Uma 
comissão de 6 membros é selecionada ao acaso do corpo docente do departamento. 
Determine a probabilidade de que todos os membros da comissão sejam professores 
assistentes. 

Existem ao todo 75 professores. De 75 uma comissão de 6 Ey EA escolhida 


de (2 ) maneiras. Como são 35 professores assistentes, existem ( é ) maneiras 


de formar uma comissão como apenas professores assistentes. Assim a probabilidade 
desejada é Се ) ГА ( 2) . Cálculos conduzem ao valor de 0,01, portanto os pro- 
fessores titulares e adjuntos não precisam preocupar-se indevidamente com a possibi- 
lidade de não ter representação na comissão. 


Exemplo 8. Considere uma mão de pôquer de cinco cartas. Determine a probabi- 
lidade. de obter um “four” (isto é, quatro cartas de mesmo valor) supondo que as 
cinco cartas são escolhidas ao acaso. 

Podemos resolver o problema da seguinte forma. 

Existem ( Е ) mãos diferentes, que deverão ser igualmente prováveis. Assim 


Q terá ( 2 ) pontos. Para que о evento desejado ocorra, devemos ter quatro cartas 


de mesmo valor. Existem 13 escolhas diferentes para o valor das cartas que irão 
compor o “four”, a saber, 2, 3, 4, 5, 6, 7, 8, 9,10, J, О, К e A. Para cada uma 
dessas escolhas (que determine quatro das cinco cartas da máo desejada) existem 
Г 48 cartas dentre as quais podemos escolher a 52 carta. Já que cada uma das 13 
Ё escolhas do “four” pode ser associada com cada uma das 48 escolhas da 52- carta, 
existem ao todo (13)(48) maneiras possíveis de obter uma mão de pôquer com 
quatro das cinco cartas iguais. A probabilidade desejada é portanto 


(13)(48) 
by 
5 
Exemplo 9. Suponha que se distribui п bolas em п caixas de tal forma que os 
n" arranjos possíveis são igualmente prováveis. Determine a probabilidade de 


a ЗАВ CIC. 


que somente a caixa 1 esteja vazia. 

Neste caso o espaço de probabilidade consiste de n” . pontos igualmente 
prováveis. Seja А o evento de que apenas a caixa 1 esteja vazia. Isto pode acontecer 
somente se as n bolas estão nas n — 1 caixas restantes de tal forma que nenhuma 
caixa esteja vazia. Assim, exatamente uma dessas (n — 1) caixas deve conter duas 
bolas, e as (n — 2) caixas restantes devem ter exatamente uma bola cada. Seja B; 
o evento de que a caixa j, j=2,3,...n, tenha duas bolas, caixa 1 esteja vazia 
eas (n — 2) caixas restantes tenham exatamente uma bola cada. Então os eventos 
B; são disuntos e А = (|), B,. Para determinar P(B;) observe que as duas 
bolas colocadas na caixa j podem ser escolhidas dentre n bolas de ( 5 ) maneiras. 
Аз (n — 2) bolas podem ser rearranjadas de (n — 2)! maneiras nas (n — 2) caixas 
restantes. Assim, o número de maneiras distintas em que podemos colocar duas 
bolas na caixa /, deixar a caixa 1 vazia e colocar exatamente uma bola em cada uma 


das caixas restantes é (5) (n — 2)!. Portanto 


P(B) = | ce 


e conseqüentemente 


Uo) 
Us 


24. PARTIÇÕES 


Uma grande variedade de problemas combinatórios que envolvem amostras 
desordenadas são do seguinte tipo. Uma caixa contém n bolas.vermelhas e b 
bolas brancas. Extrai-se sem reposição da caixa uma amostra aleatória de tamanho л. 
Qual é a probabilidade de que a amostra contenha exatamente k bolas vermelhas 
(e portanto n — К bolas pretas?) 

Para resolver o problema, argumentamos como segue. Estamos interessados 
apenas no número total de bolas vermelhas e bolas pretas e não na ordem em que 
elas são extraídas. Isto é, estamos lidando com amostragem sem reposição e sem 
consideração da ordem. Podemos, portanto, tomar o nosso espaço de amostra 


como sendo a coleção de id Ы у ) amostras de tamanho п que podem ser extraídas 
dessa maneira das r + b bolas da população. Associamos a probabilidade ( b pi | E 
a cada uma dessas ( b у ) amostras. Devemos determinar a seguir o nümero de 
maneiras em que se pode extrair uma amostra de tamanho п, de modo que contenha 
exatamente k bolas vermelhas. De r bolas vermelhas pode-se extrair k bolas 
vermelhas de (2) maneiras, sem considerar a ordem, e de b bolas pretas pode-se 
escolher n — k bolas pretas de ( A b %) maneiras, sem considerar a ordem. Como 
podemos associar cada escolha de k bolas vermelhas com cada escolha de n — k 
bolas pretas, existem um total de ( г) ( » b A escolhas possíveis. Assim a proba- 


bilidade desejada é 
p b 
kJ An — 


+ Б 
Us) 
A essência deste tipo de problema é que a população (neste caso as bolas) 
é particionada em duas classes (bolas vermelhas e pretas). Toma-se uma amostra 
aleatória de um certo tamanho e deseja-se determinar a probabilidade de que a 
amostra contenha nümeros específicos de itens das duas classes. 


Em alguns problenías deste tipo as duas classes não são definidas explicita- 
mente, mas podem ser identificadas a partir dos enunciados. 


Exemplo 10. Uma mão de pôquer consiste de cinco cartas extraídas de um baralho 
comum de 52 cartas. Obtenha a probabilidade de que a mão tenha exatamente 
dois reis. - 

Para resolver o problema, observe que existem em máos de póquer. Num 
baralho existem 4 reis e outras 48 cartas. Isto particiona as cartas em duas classes, 
reis e não-reis, tendo 4 e 48 cartas, respectivamente. A mão de pôquer é uma 
amostra de tamanho 5 extraída sem reposição e sem consideração de ordem da 
população de 52 cartas. O problema é assim o de determinar a probabilidade de 
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ta 


que a amostra contenha 2 membros da primeira classe e 3 da segunda. Portanto 


a probabilidade desejada é 
5) 48 
M A3 3,99 X 107 
E Ж | 
5 
Exemplo 11. Um baralho de cartas tem 4 naipes de 13 cartas: paus, ouros, copas 
e espadas. 


(a) Qual é a probabilidade de que em uma mão de 5 cartas exatamente 3 
sejam paus? 

(b) Qual é a probabilidade de que em uma mão de 5 cartas exatamente 3 
sejam do mesmo naipe? 


Para resolver (a) observe que as condições do problema dividem o baralho 
de 52 cartas em duas classes. A primeira é a de “paus” com 13 membros, e a classe 
dois é a de “não-paus” com 39 membros. As 5 cartas constituem uma amostra de 
tamanho 5 de uma população de 52 cartas, e o problema requer que 3 das 5 cartas | 
sejam da classe 1. Assim, a probabilidade desejada é 

( A (2) 
р = DIAZ) вх 107 
52 2 А 
(5) 

Para resolver (b), seja 4; о evento de que exatamente trés cartas sejam 
paus, 45, о de que exatamente três sejam ouros, Аз о de que exatamente três 
sejam copas е Ад о de que exatamente três sejam espadas. Então, como existem 
apenas 5 cartas na mão, os eventos 4,, 44, 4з e A4 são mutuamente disjuntos. 


Sua união А, UA; VA; U Аг éo evento de que exatamente 3 das 5 cartas sejam 
do mesmo naipe. Assim a probabilidade desejada é 4p. 

Exemplo 12. Considere novamente uma mão de pôquer de 5 cartas. Qual é a proba- 
bilidade de que ela seja um “full house” (isto é, um par de cartas de igual valor 
e uma trinca de cartas de igual valor), supondo que as cartas são extraídas do ba- 
ralho ao acaso? 

Para resolver o problema, observamos novamente que existem a ) mãos 
equiprováveis de pôquer. Dentre elas devemos agora determinar o número de ma- 
neiras em que podemos ter um par e uma trinca. Considere o número de maneiras 
em que podemos escolher uma trinca particular, digamos 3 ases, e um par particular, 
digamos 2 reis. A trinca tem 3 cartas que serão escolhidas sem consideração de 
ordem dentre 4 ases, e isso pode ser feito de ( : ) maneiras. O par tem 2 cartas 
que serão escolhidas sem consideração de ordem dentre 4 reis. Isso pode ser feito 
de ( 1 maneiras. Então o número total de maneiras de se obter uma mão com 


a 
ә 


tn 


uma trinca de ases e um par de reis é ( : o ). Assim, a probabilidade de obter uma 

mão com uma trinca de ases e um par de reis é ( 1) ( > ГА m) — p. Naturalmente 

esta probabilidade seria a mesma para qualquer par específico e qualquer trinca 

específica. Mas o valor das cartas da trinca pode ser qualquer um dos 13, e o valor 

das cartas do par, pode ser qualquer um dos 12 restantes. Como cada um dos 13 va- 

lores da trinca pode ser associado a cada um dos 12 valores do par, existem (13)(12) q 
escolhas desse tipo. Cada uma dessas escolhas constituem um evento disjunto tendo 
probabilidade p, de modo que a probabilidade desejada é 


_ (13)(12)04)(6) 
{ 


(13)(12)р в 144 X 10^?. 


Exemplo 13. Qual é a probabilidade de obter exatamente dois pares? Aqui uma 
mão como (2, 2, 2, 2, x) não conta como dois pares mas como uma quadra. 


Para resolver o problema observamos que se a mão tem dois pares, então 
duas cartas tem o mesmo valor x, duas tem o mesmo valor y x ea quinta carta 
tem um valor diferente de x e y. Existem 13 valores diferentes. Os valores dos 
pares podem ser escolhidos de (15) maneiras. A outra carta pode ter qualquer 


um dos 11 valores restantes. As duas cartas de valor x podem ser escolhidas dentre 


4 cartas deste valor de (4) maneiras, o mesmo valendo para as duas cartas de 


valor y. A ültima carta de valor z pode ser escolhida de (3) =4 maneiras dentre 
as quatro com esse valor. Assim o número total de escolhas é (5 (11) (4) (55, 


e portanto a probabilidade desejada é 


13 
2 хоч 
| | 


Em alguns problemas envolvendo partições as classes são imaginadas como 
no exemplo a seguir. e! 


Exemplo 14. Suponha que temos uma caixa contendo r bolas numeradas de 1 a r. 
Torna-se uma amostra aleatória sem reposição de tamanho n e registra-se os nú- 
meros das bolas. Repõe-se as bolas a caixa e torna-se uma segunda amostra aleatória 
sem reposição de tamanho m. Determine a probabilidade de que duas amostras 
tenham exatamente k bolas em comum. 


Para resolver este problema podemos argumentar como segue. O efeito da 
primeira amostra é participar as bolas em duas classes: as n bolas selecionadas 
eas r — п não-selecionadas (podemos imaginar que as п bolas da primeira amostra 
são pintadas de vermelho antes de serem repostas nas caixas). O problema é então 
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determinar a probabilidade de que a amostra de tamanho п contenha exatamente 
k bolas da primeira classe, de modo que a probabilidade desejada é 


() (2%) 


(a) 


Se o argumento fosse conduzido de forma inversa e pensássemos na segunda 
amostra fazendo a partição obteríamos a probabilidade 


(8) (к<). 
(1) 


Deixamos como exercício mostrar que essas duas probabilidades são iguais. 

Podemos estender facilmente a nossa consideração de dividir uma população 
em duas classes para т > 2 classes. Suponha que temos um conjunto de r objetos 
tais que cada objeto é de um dos m tipos possíveis. A população consiste de r, 
objetos do tipo 1, 7 objetos do tipo 2, ..., Fm Objetos do tipo m, onde 


FQ, +; 9-225 t rQ =r. Extraindo-se uma amostra aleatória sem reposição de ta- 
manho n da população desses r objetos, qual é a probabilidade de que a amostra 
contenha exatamente kı, objetos do tipo 1, ..., Аһ. objetos do tipo m onde 
bue o n? 


Uma vez mais o espaço de probabilidade é a coleção das (7 


n 
mente prováveis de tamanho n que se pode extrair sem reposição e sem conside- 
ração de ordem da população de r objetos. Pode-se escolher os К; objetos do 


) amostras igual- 


tipo i na amostra dos r; objetos deste tipo na população sem consideração de 
ordem de (É ) maneiras. Assim, a probabilidade de escolher a amostra com a 


composição especificada é 


Exemplo 15. Em uma mão de 13 cartas de um baralho comum, obtenha a probabi- 
lidade de ocorrer exatamente 3 paus, 4 ouros, 4 copas e 2 espadas. 

Neste problema r = 52 e п = 13. бе aclasse 1 é constituída de paus, classe 2 de 
ouros, classe 3 de copas e classe 4 de espadas, então m = 4, К, = 3, k, = 4, Кз = 4, 
e k4 = 2, de modo que a probabilidade desejada é 


(2) (8) (8) (5) 
(5) 
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Exemplo 16. Problema de comissão. No problema da comissão discutido anterior- 
mente, obtenha a probabilidade de que uma comissão de 6 membros seja composta 
de 2 professores titulares, 3 professores adjuntos e 1 professor assistente. 

Usando o método acima, obtemos a resposta como sendo 


GGG) 


б 


2.5. UNIÃO DE EVENTOS* 

Considere novamente a permutação aleatória de n objetos distintos. Dizemos 
que ocorre um encontro na i-ésima posição se o i-ésimo objeto ocupa a i-ésima posição. 
Seja 4; о evento de que ocorre um encontro na posição i. Então А = Ji=, А; 
é o evento de que ocorre pelo menos um encontro. Podemos determinar P((J7., 4;) 
para п = 2 através da Equação (10) do Capítulo 1 que estabelece que 

P(A о А) = Р(А,) + Р(А,) — P(A, n A5). 
É possível usar esta fórmula para obter uma fórmula semelhante para n = 3. 
Sejam 4,,4, е Аз três eventos e seja B = А, VA,. Então 
P(A, U A; U Аз) = P(B о Аз) = P(B) + PA) — P(B г Аз). 


Mas 

(4) P(B) = P(A, о A5) = P(A,) + P(A) — P(A, n 45). 

сото BNA; = (4; UA5)U Аз = (A41 П A3) U(A5 П As), segue-se que 
(5) P(B су Аз) = P(A; ^ Аз) + Р(А; г A) — PULO A5 су As). 


Substituindo (4) e (5) na expressão de P(A, VA; U Аз), vemos que 
P(A, u A; о Аз) = [PUD + Р(А,) — P(A, ^ А] + Р(А;) 


— [P(A NA) A+ PA, 0 45) — P(A, т 44 8 A3)] 
= [Р(А,) + P(4,) + P(43)] 
— [P(A, A A2) + P(A, ^ Аз) + P(A5 ^ A3)] 


+ P(4, А; n Аз). 
Para expressar esta fórmula de maneira mais conveniente, fazemos 
S, = P(A) + Р(А,) РМ), 


S, P(A, б 45) + P(A, n 45) + P(A; n А3), 
Sa = Р(А, гу AS RAS): 
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Então 
(6) P(A, VA, VÃ) = 8. = So dos: 


Existe uma generalização de (6) que é válida para todo número inteiro po- 
sitivo n. Considere os eventos 4,,445,..., 45. Defina n números S, 1 &r&n, 
através de 


5, = y P(A, 0*0 4). 
I<xij<-.<ip<n 
Então, em particular 
S, = PA) ++ P(A,), 
=i n 
D = Y PANA), 
i=1 j=i+1 


S, = P(A, n** n A). 
A fórmula desejada para P(|J?-; 4;) é dada por 
(7) Р(() а) - ў (= 1)" *8, 
| = 5; — 5, +555 4 (07-15, 


О leitor pode facilmente verificar que esta fórmula está de acordo com (6) se n = 3 
e com a Equação 10 do Capítulo 1 se n = 2. A demonstração de (7) se faz por 
indução, sendo análoga a de (6). Omitiremos os detalhes da demonstração. 

A soma S, tem n termos, a soma 5, tem (5) termos, e em geral a soma 
S, tem ү) termos. Isto pode ser verificado observando que a r-ésima soma é 


r 
simplesmente a soma dos números P(A; ``‘ Aj) sobre todos os valores dos 
índices tys iz, ...,i, täis que i, €i; <--- <i,. Osíndices assumem valores entre 


1 e n. Assim o nümero de diferentes valores que estes índices podem assumir 
é igual ao número de maneiras diferentes em que podemos selecionar r números 
distintos dentre n números, sem reposição e sem consideração de ordem. 


2.6. PROBLEMAS DE ENCONTRO 

Podemos agora resolver facilmente o problema do número de encontros. Seja 
А; o evento de que ocorre um encontro na posição i e seja Pn a probabilidade 
de que não ocorra nenhum encontro. Para determinar 1 —р„ =P(UJi=: А), preci- 


samos determinar Р(А O A; -:** O A;) onde iy,iz,...,i, são r números dis- 
tintos (1, 2,..., n). Mas esta probabilidade é simplesmente a probabilidade de 
ocorrer um encontro em cada uma das posições ij, i2,...,iy, е já determinamos 
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esta probabilidade como sendo (n — r)!/n!. Como a r-ésima soma S, tem exa- 
tamente (5 termos, vimos que 
E 


PA, 0:0 А) = У Ё m r)! (=! 


= п! 


= у (=! ай st 


r=1 rY(n ="! n! 
n E dte 
ARES Dodd 
r-i r 
Istoé, . 
Ed o dq эм e s mn 
Usando (8), vemos que a probabilidade p, de que não ocorra encontros é 
1 1 (-1y п. (=p! 
9 „=1-1+—-—+зз+-+——= у M. 
9) E 21— 3! n! kzo К! 


Vemos que o segundo membro de (9) é simplesmente os primeiros n + 1 
termos da expansão de e! em série de Taylor. Portanto, podemos aproximar 
Pn por e! eobter 1 — e^! = 0,6321... como uma aproximação de (1 — pn). 
Verifica-se que esta aproximação é extremamente boa, mesmo para valores pequenos 
de n. Na tabela abaixo apresentamos valores de (1 — pn) para diversos valores de n. 


0,6667 0,6250 0,6333 


Temos assim, o extraordinário resultado de que a probabilidade de ocorrer 
pelo menos um encontro entre n objetos permutados aleatoriamente é pratica- 
mente independente de n. 

O problema de encontros pode ser reformulado de várias maneiras diferentes. 
Uma das mais famosas é a seguinte: Toma-se dois baralhos equivalentes de cartas 
e forma-se pares com uma carta de cada baralho. Qual é a probabilidade de ocorrer 
pelo menos um encontro? 

Para resolver o problema precisamos observar apenas que se pode usar o pri- 
meiro baralho para determinar as posições (caixas). Sem perda de generalidade 
podemos supor que as cartas do primeiro baralho estão arranjadas na ordem 
1, 2, .. . , n. Associa-se então as cartas do segundo baralho (bolas) às posições 
determinadas pelo primeiro baralho. Um encontro ocorre na posição і se, e somente 
se, a i-ésima carta extraída é a de número i. 


— —— 
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Agora que sabemos como determinar a probabilidade p, de nenhum en- 
contro, podemos obter facilmente a probabilidade f,(r) de que haja exatamente 
r encontros. Para resolver o problema, determinamos inicialmente a probabilidade 
de que haja exatamente r encontros e que estes ocorram nas primeiras r posições. 
Isto pode acontecer somente se não houver encontros nas (n — ғ) posições restantes. 
A probabilidade de que não haja encontros em j objetos permutados aleatoriamente 
é ру. Portanto, j! ру é o número de maneiras em que se pode permutar j objetos 
entre si de modo que haja encontros (Por quê?). Já que existe apenas uma maneira 
de ter r encontros nas primeiras r posições o número de maneiras em que podemos 
ter ғ encontros nas primeiras r posições e não ter nenhum encontro nas (n — r) 
posições restantes é (n —r)! P, — ,. Assim, a probabilidade desejada é 


Eis al 
E n! : 


r п-т 


A probabilidade de que haja exatamente r encontros e que estes ocorram ет 7 
posições específicas quaisquer é a mesma para todas as especificações das posi- 
ções, isto é, a. 

Para resolver o problema de que haja exatamente r encontros, tudo que 
é necessário perceber agora é que os eventos “exatamente r encontros ocorrendo 
nas posições À, ij, . . . , ij" são eventos disjuntos para as diversas escolhas de 
i,i,,...,i,. O número de tais escolhas é ( П ) . Assim, a probabilidade desejada 
é (7) a. Portanto, se Bn(r) é a probabilidade de que ocorra exatamente r en- 
contros entre n objetos permutados aleatoriamente, obtemos 


(10) Ву = nto, 


n! (п = тра. 


r!(n — r)! n! 

RH 
r! 

"xd | Ef ver РО cae IE 
r! 2! ‚(п = т)! 


Usando o fato de que р, _; é aproximadamente igual а e”! (aproximação 
que é bastante boa mesmo рага п — r moderadamente grande) obtemos 


Ea | 


(1) В) а —— . 
Р pi 


Como ilustração final dessas idéias, determinaremos a probabilidade de que 
ocorra um encontro na posição /, dado que ocorrem exatamente r encontros. 
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Para resolver este problema, seja А, o evento de que ocorre um encontro 
na posição j e B, o evento de que ocorram exatamente r encontros. A proba- 
bilidade desejada é P(4;/B,). De (10) temos P(B,) = pn —.,/r!, de modo que pre- 
cisamos determinar P(A; O B,). Mas o evento 4; N B, ocorre se, e somente se, 
existe um encontro na j-ésima posição e existem exatamente (r — 1) encontros 
nas (n — 1) posições restantes. O número de maneiras em que podemos ter exa- 
tamente (7 — 1) encontros em (л Hi 1) posições é (n — 1)! Ba ., (r — 1). Assim 


PA, GB) üt DB —.1) 


n! 


Portanto 
p. Т! r 
VAGUE EUER) dum =, 
IL n(P:— DU рс, ш 


2.7. PROBLEMAS DE OCUPACAO 


Uma grande variedade de problemas combinatórios de probabilidade são 
equivalentes ao problema de distribuir n bolas distintas em r caixas distintas. 
Como qualquer uma das п bolas pode ocupar qualquer uma das r caixas, existem 
ao todo 7" maneiras diferentes de distribuir as bolas nas caixas. Supondo que a 
distribuição é feita ao acaso, cada uma dessas maneiras tem probabilidade r”. 
O espaço de probabilidade Q para este experimento tem portanto r” pontos 
igualmente prováveis. Nos problemas envolvendo esta distribuição de bolas, im- 
pomos diversas condições sobre a ocupação das caixas e perguntamos qual a pro- 
babilidade de que ocorra a situação especificada. Como primeiro exemplo considere 
o problema seguinte. 


Distribuindo-se aleatoriamente п bolas em r caixas, qual é a probabilidade 
de que nenhuma caixa contenha mais de uma bola? 

Para resolver o problema, observe antes de mais nada que a probabilidade 
desejada é O se n >r, por isso suponha que п <r. Então (pensando na distribuição 
das bolas uma a uma) a primeira bola pode ir para qualquer uma das r caixas, 
a segunda para qualquer uma das (r — 1) caixas restantes etc., de modo que existem 
ao todo (7), maneiras diferentes. A probabilidade desejada é então (r),/r”. 


Esta probabilidade é exatamente a mesma de extrair com reposição uma 
amostra de tamanho п de uma população de ғ objetos e obter uma amostra em 
que todos os objetos são distintos, Observe também que 7" é o número de amostras 
de tamanho п de uma população de r objetos distintos. Isto não é acidental. 
Extrair aleatoriamente n objetos com reposição é formalmente o mesmo que 


distribuir aleatoriamente n bolas em r caixas. Isto pode ser constatado simples- 
mente pensando na distribuição das bolas nas caixas da forma seguinte. Extraímos 
primeiro uma amostra de tamanho п de um conjunto de r objetos, e se o i-ésimo 
elemento de amostra for о j-ésimo objeto, colocamos a bola і па caixa j. As vezes 
é útil pensar na amostragem aleatória com reposição desta maneira, isto é, como distri- 
buição aleatória de bolas em caixas (veja o problema de cupom ao final do capítulo). 

Considere a distribuição aleatória de п bolas em r caixas. Qual é a proba- 
bilidade de que uma bola específica, digamos bola j, esteja em uma caixa específica, 
digamos caixa i? Se a bola j está na caixa i, temos (n — 1) bolas para distribuir 
nas r caixas sem restrição quanto ao destino das bolas. Pode-se colocar a bola j 
na caixa і de uma maneira apenas, e as (n — 1) bolas restantes podem ser colocadas 
nas ғ caixas de r”! maneiras. Assim a probabilidade desejada é r"^!/r" = 1/r. 

Traduzindo em linguagem de amostragem aleatória, vemos que em uma amostra 
aleatória de tamanho n, extraída com reposição de uma população de r objetos, é 
igualmente provável que o j-ésimo elemento da amostra seja qualquer um dos 
r objetos. 

As considerações acima estendem-se facilmente de uma caixa específica para 
k caixas, 1 < К < r. Deixamos como exercício mostrar que a probabilidade de 
que k bolas específicas ocupem k caixas específicas é simplesmente r^* 
Em linguagem de amostragem aleatória este resultado diz que se extrairmos com 
reposição uma amostra de tamanho n de uma população de r objetos, a probabili- 
dade de que o j,-ésimo, j,-ésimo, ...Jy-ésimo elementos da amostra sejam К obje- 
tos específicos quaisquer é r ^*. 

Seja Aj(i) o evento de que o j-ésimo elemento da amostra é o i-ésimo objeto. 
Então acabamos de dizer que para qualquer escolha ji <j} <---<jp 1I<kK<n, 
de elementos de amostra (isto é, bolas) e qualquer escolha i;,i,,...,ik de objetos 
(isto é, caixas), temos 


PAC) ^ Ai) Os ALGO) = т“, 
Como P(Aj(i)) ^ ғ"! para qualquer j е i, temos que 


(12) P(A; (is) Н Aj (iy) = P(A;,(i4)) il P(A, (ii). 


Como esta relação é válida para todo k e todas as escolhas de j;,...,jk, vemos 
que os eventos A4(i,), ... , An(in) são mutuamente independentes para qualquer 
Ij D gs i 

Se pensamos na extração aleatória de uma amostra de tamanho n de um 
conjunto de r objetos distintos como n repetições do experimento de escolher 
ao acaso um objeto deste mesmo conjunto, vemos que a afirmação de que os eventos 
Aı(iı), . . ., An(in) são independentes significa que o resultado de um experimento 
não tem influência alguma sobre os resultados dos outros experimentos. Natural- 
mente isto está bem de acordo com a noção intuitiva de amostragem aleatória. 
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Exemplo 17. Suponha que se distribui aleatoriamente п bolasem r caixas. Obtenha 
a probabilidade de que tenha exatamente k bolas nas primeiras ғ; caixas. 

Para resolver o problema observe que a probabilidade de que uma dada bola 
esteja em uma das primeiras ғ caixas, é r,/r. Pense na distribuição de п bolas 
como п repetições do experimento de colocar uma bola em uma das r caixas. 
Suponha que o resultado é considerado sucesso se a bola cai em uma das primeiras 
гү caixas, e fracasso caso contrário. Então, do resultado da Seção 1.5., vemos 
que a probabilidade de que as primeiras 7, caixas contenham exatamente k bolas é 


ку» 


2.8. NÜMERO DE CAIXAS VAZIAS 


Voltamos a considerar novamente o problema da distribuição aleatória de 
n bolas em 7r caixas e investigamos a probabilidade py(r,n) de que exatamente 
k caixas estejam vazias. | 

Iniciamos a resolver o problema representando por A; o evento de que a 
i-ésima caixa está vazia. Para que este evento ocorra, todas as n bolas devem estar 
nas (r— 1) caixas restantes, e isto pode acontecer de (r— 1)" maneiras. Assim, 
REA РЕ. 

De maneira semelhante, se 1 <i, < i? <---<ik <r, oevento Aj, NA; NM... 
N Ар, Ocorre se, e somente se, todas as bolas estiverem nas r — k caixas restantes. 
Conseqüentemente Р(А;, N ·· Aj) - (r — k)”/r” = (1 — k/r)". Podemos agora 
aplicar (7) para determinar a probabilidade de А, О... ЈА, que é simplesmente о 


evento de que pelo menos uma caixa esteja vazia. Nesta situação Sg = И (1 — k/r)", 
de modo que usando (7) obtemos ` 
P(A, uc АД = У E S 


k=1 


ЕЕ 


к= 1 


Il 


Assim a probabilidade po(r,n) de que todas as caixas estejam ocupadas é 
(13) | polr, n) = 1 — P(A, UVA) 


у= (1) (1 - | 


j=1 Ji А 


E EA () ( E "i 


Como etapa seguinte determinamos a probabilidade ay(r, п) de que exa- 
tamente k caixas específicas (digamos as primeiras k caixas) estejam vazias. Este 
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evento pode ocorrer se todas as п bolas estiverem nas (r — К) caixas restantes 
e se nenhuma dessas r— k caixas estiverem vazias. O número de maneiras em que 
podemos distribuir n bolas em (7 — k) caixas de modo que nenhuma caixa fique 
vazia é (r — k)” po(r — К, n). Assim, a probabilidade desejada é 
r — k"polr — k,n 
(14) NM Уры EE 
z 


E ( x *J рит а). 
E 


Podemos agora determinar facilmente as probabilidades py(r,n). Para cada escolha 
de k números distintos ij, iz, ..., iy do conjunto de números (1,2,...,n), 
o evento(exatamente k caixas і, і, ...,ік vazias|tem probabilidade ар (ғ, n) 


e estes eventos são mutuamente disjuntos. Existem (%) tais eventos e sua união 


é simplesmente o evento exatamente k caixas vazias. Assim 


(15) pdr, т) = (p) (1 =- D pote — k nò: 


Usando a expressão de po(r,n) dada em (13) vemos que 


E FR ЕИ - 158) 
(16) мт = С (ASA, 
Como acontece com o problema dos encontros, os problemas de ocupação 
têm diversas formulações. Apresentamos a seguir uma das mais famosas entre elas. 
Problema do cupom. Coloca-se cupons ou, nos dias atuais, brinquedos nas 
caixas de cereais para atrair compradores infantis. Suponha que existem r tipos 
de cupons ou brinquedos e que é igualmente provável que uma dada caixa contenha 
qualquer um deles. Suponha que se adquire n caixas, determine a probabilidade de 


(a) obter uma coleção com pelo menos um de cada tipo, 
(b) não obter exatamente k dos r tipos de cupons ou brinquedos. 


Exercícios 


1. O código genético especifica um aminoácido através de uma sequência de três nu- 
cleotídeos. Cada nucleotídeo pode ser de um dos quatro tipos Т, А, C e G, sendo 
permitidas as repetições. Quantos aminoácidos podem ser codificados desta 
maneira? 


һә 


О código Morse consiste de uma seqüéncia de pontos е traços em que repetições 
são permitidas. 


а р” 


(a) Quantas letras se pode codificar usando exatamente n símbolos? 
(b) Qual é o número de letras que se pode codificar usando n ou menos 
símbolos? 


‚е mm —— 
J 
Un 
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lil: 


. Um homem possui. п chaves das quais, exatamente uma abre a fechadura. 


Ele experimenta as chaves uma de cada vez, escolhendo ao acaso em cada ten- 
tativa uma das chaves que não foram experimentadas. Determine a probabilidade 
de que ele escolha a chave correta na r-ésima tentativa. 


. Um ônibus parte com 6 pessoas e para em 10 pontos diferentes. Supondo que 


os passageiros têm igual probabilidade de saltar em qualquer parada, determine 
a probabilidade de que dois passageiros não desembarquem na mesma parada. 


. Suponha que temos r caixas. Bolas são colocadas aleatoriamente nas caixas, 


uma de cada vez, até que alguma caixa contenha duas bolas pela primeira vez. 
Determine a probabilidade de que isto ocorra na n-ésima bola. 


. Uma caixa contém r bolas numeradas de 1 а r. Seleciona-se ao acaso N bolas 


da caixa (onde № <r), registra-se os seus números e repõe-se as V bolas na caixa. 
Se esse processo é repetido r vezes, qual é a probabilidade de que nenhuma 
das N bolas originais seja duplicada? 


. Se Sam e Peter estão entre n homens dispostos aleatoriamente em uma fila 


qual é a probabilidade de que haja exatamente k homens entre eles? 


. Um dominó é um bloco retangular dividido em dois sub-retângulos, como 


ilustra a figura abaixo. Cada sub-retângulo possui um número; sejam x e y 
esses números (não necessariamente distintos). Como o bloco é simétrico, 


o dominó (х, у) é o mesmo que (y, x). Quantos blocos diferentes de dominó 
se pode fazer usando n números diferentes? 


. Considere o problema de encontros envolvendo n objetos e sejam i e r duas 


posições específicas distintas. 


(a) Qual é a probabilidade de que ocorra um encontro na posição i e não 
ocorra na posição 7? 

(b) Dado que não ocorre um encontro na posição r, qual é a probabilidade 
de um encontro na posição i? 


Suponha que se distribui n bolas em n caixas. 


(a) Qual é a probabilidade de que exatamente uma caixa esteja vazia? 
Sugestão : use o resultado do Exemplo 9. 

(b) Dado que a caixa 1 está vazia, qual a probabilidade de que somente uma 
caixa esteja vazia? 

(c) Dado que somente uma caixa está vazia, qual a probabilidade de que a 
caixa 1 esteja vazia? 


Se distribuímos aleatoriamente n bolas em r caixas, qual é a probabilidade 
de que a caixa 1 contenha exatamente j bolas, 0 < j < n? 


ы 


12. Mostre que 


13. Uma caixa contém b bolas pretas e r bolas vermelhas. Bolas são extraídas 

sem reposição, uma de cada vez. Determine a probabilidade de obter a primeira 
bola preta na n-ésima extração. 
O problema seguinte diz respeito a mãos de pôquer. Um baralho tem 52 cartas. 
Estas cartas consistem de 4 naipes chamadas paus, ouros, copas e espadas. 
Cada naipe tem 13 cartas com os símbolos 2, 3, 4,..., 10, J, Q, K, A. Uma 
mão de pôquer consiste de 5 cartas extraídas do baralho sem reposição e sem 
consideracáo de ordem. Considera-se que constituem seqüéncias as máos dos 
seguintes- tipos A. 2, 3.4.5.2, 3.4/5.6:...: 10 LOKA 

14. Determine a probabilidade de ocorrência de cada uma das seguintes mãos de 
pôquer: 


(a) Royal flush ((10, J, Q, K, A) do mesmo naipe); 

(b) Straight flush (cinco cartas do mesmo naipe em seqüéncia); | 

(c) Four (valores da forma (x, x, x, x, y) onde x e y sáo distintos); 

(d) Full house (valores de forma (x, x, x, y, y) onde x e y são distintos); 

(e) Flush (cinco cartas do mesmo naipe); 

(f) Straight (cinco cartas em sequência, sem consideração de naipes); 

(g) Trinca (valores de forma (x, x, x, y, 2) onde x, y, e z são distintos); 

(h) Dois pares (valores da forma (x,x,y,y,z) onde x, y e 2 são distintos); 
(i) Um par (valores da forma (w, w, x, y, z) onde м, х, у e z são distintos). 


15. Uma caixa contém dez bolas numeradas de 1 a 10. Seleciona-se uma amostra 
aleatória de 3 elementos. Determine a probabilidade de que as bolas 1 e 6 
estejam entre as bolas selecionadas. ) 

16. Extrai-se uma а uma as cartas de um baralho comum até obter o primeiro 
rei. Determine a probabilidade de que isto ocorra na n-ésima carta extraída. 


17. Suponha que se extrai uma amostra de tamanho n de uma população de r 
elementos. Determine a probabilidade de que nenhum dos k elementos espe- 
i cíficos esteja na amostra se o método utilizado é 


(a) amostragem sem reposição; 
(b) amostragem com reposição. 


| 18. Suponha que se extrai, sem reposição, uma amostra de tamanho п de uma 

i população de r elementos. Obtenha a probabilidade de que k objetos dados 
estejam incluídos na amostra. 

19. Suponha que se permuta n objetos aleatoriamente entre si. Mostre que a 

x3 


probabilidade de que k objetos específicos ocupem k posições específicas 
é (n — K)!/n!. 


21. 
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Em relacáo ao Exemplo 14, mostre que 
A is —n ) i |. = ig 
M Wwe Ko YET YS — A) 
r r 
ү) („) 
Uma caixa contém 40 fusíveis bons е 10 defeituosos. Supondo que se seleciona 
10 fusíveis, qual é a probabilidade de que todos eles sejam bons? 


. Qual é a probabilidade que as mãos norte e sul de bridge juntas (um total de 


26 cartas) contenham exatamente 3 ases? 


. Qual é a probabilidade de que de 4 cartas extraídas de um baralho, 2 sejam 


pretas e 2 vermelhas? 


. Determine a probabilidade de que uma mão de pôquer não contenha nenhuma 


carta inferior a 7, dado que contém pelo menos uma carta superior a 10, onde 
ases são consideradas cartas altas. 


25. Se você possui 3 bilhetes de uma loteria para a qual se vendeu n bilhetes e 


existem 5 prêmios, qual a probabilidade de você ganhar pelo menos um prêmio? 


. Uma caixa de 100 retentores contém 5 itens defeituosos. Qual é a probabilidade 


de que dois retentores selecionados ao acaso (sem reposição) da caixa sejam 
ambos bons? 


27. Considere duas caixas, cada uma com 7r bolas numeradas de 1 a r. Toma-se 


de cada caixa uma amostra aleatória sem reposição de tamanho 7 & r. 
Obtenha a probabilidade de que as amostras contenham exatamente k ele- 
mentos em comum. 


VARIÁVEIS ALEATÓRIAS DISCRETAS 


Considere o experimento de lançar uma moeda três vezes em que a probabi- 
lidade de obter cara em um lançamento individual é p. Suponha que ganhemos $ 1 
dólar para cada lançamento que resulte em cara, mas percamos $ 1 dólar para cada 
lançamento que resulte em coroa. Nesta situação, a quantidade de interesse é clara- 
mente o nosso ganho total. Seja X essa quantidade. É claro que X pode assumir 
somente os valores $3, $1, —$1 e —$3. Não podemos dizer com certeza qual 
destes será o valor de X, uma vez que este valor depende do resultado de nosso 
experimento aleatório. Se, por exemplo, o resultado for HHH, X será $3; enquanto 
para o resultado HTH, X será $1. Na tabela abaixo listamos os valores de X 
(em dólares) correspondentes a cada um dos oito possíveis resultados. 


0 Х(о) Pío) 
HHH 3 р? 
HHT 5 pd — p) 
HTH 1 p — р) 
THH 1 р?(1 — p) 
HIT zi p — py 
THT E pa — р)? 
TTH | -1 pa — р)? 
ттт E (À = gy 


Podemos pensar em X como uma função real no espaço de probabilidade 
correspondente ao experimento. Então, para cada w € 9, X(w) é um dos valores 
3, 1, —1, —3. Considere, por exemplo, o evento (tw: X(w) = 1). Este conjunto 
contém os três pontos w2, оз e wa correspondentes aos resultados HHT, HTH 
e THH, respectivamente. A última coluna da tabela dá as probabilidades associadas 


aos oito resultados possíveis do experimento. Desta tabela vemos que o evento 
{w:X(w) = 11 tem probabilidade 3p?(1 — p). Geralmente expressamos este fato 
abreviadamente dizendo que { X = 1 | tem probabilidade 3p?(1 —p). Considerações 
similares naturalmente se aplicam a outros valores que .X pode assumir. Vemos por- 
tanto que para cada valor possível de X existe uma probabilidade precisamente 
definida de X assumir esse valor. Como veremos na seção seguinte, a quantidade 
X éum exemplo do que se chama variável aleatória discreta. 


3.1. DEFINIÇÕES 

Seja (9, .27, P) um espaço arbitrário de probabilidade e seja X uma função 
real em О, tomando apenas um número finito ou infinito enumerável de valores 
X1, X2, . .. Como no exemplo que acabamos de dar, certamente gostaríamos de 
poder falar na probabilidade de que X assuma o valor x; para cada i. Para isso, 
precisamos saber que { о € 9: X(w) = xj } é um evento, isto é, um membro de 
«4 para cada i. Se, como no exemplo anterior, «/ é o o-álgebra de todos os sub- 
conjuntos de Q, este certamente é o caso. Pois neste caso, não importa qual seja 
xj, { о: М(о) = xj ) é um subconjunto de Q e portanto um membro de .2, 
já que . contém todos os subconjuntos possíveis de О. Entretanto, como in- 
dicamos na Seção 1.2., em geral Z não consiste de todos os subconjuntos de Q, 
de modo que não temos nenhuma garantia de que { w € Q: X (w) =x; } esteja em 
27. A única saída razoável é supor explicitamente que X é uma função em Q 
tal que satisfaça a condição desejada. Isto nos conduz à definição a seguir. 


Definição 1. Uma variável aleatória discreta real X, em um espaço de 
probabilidade (Q, 4, Р), é uma função X cujo domínio é Q e cujo 
contradomínio é um subconjunto finito ou infinito enumerável (x,,X,,...! 
dos números reais R tal que | w:X(w) =x; | é um evento para todo i. 


Então { w: X(w) = x; ) é por definição um evento e podemos falar de sua 
probabilidade. Por brevidade representamos em geral o evento | w: X(w) = xj 
pori X =x; |, e a probabilidade deste evento рог P(X = х;) em vez de 
P(| co: X (co) =x; ). 


Seja X uma variável aleatória discreta real. Então { w: X(w) = x | é um 
evento para qualquer número real x. Realmente, se x1, X2, ... são os valores 
que X pode assumir,| c: X(w) = x; | é um evento de acordo com a definição 
de uma variável aleatória discreta real. Se x não é um desses valores, então 
| о: Х(о) = х | = ф que também é um evento. 

Se os valores possíveis de uma variável aleatória discreta X consistem apenas 
de números inteiros ou de números inteiros não-negativos, dizemos que X é uma 
variável aleatória inteira ou uma variável aleatória inteira não-negativa, respectiva- 
mente. A maioria das variáveis aleatórias discretas, que ocorrem nas aplicações, 
são inteiras não-negativas. 
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Definição 2. Chama-se função discreta de densidade X a uma função real 7 
definida por f(x) = Р(Х = x). Diz-se que um número real х é um valor 
possível de X se /(х) 2 0. 


Representaremos a função de densidade de X por fy sempre que necessário 
para indicar que ela é função de densidade relativa à variável aleatória X. 


ix Exemplo 1. Seja X a variável aleatória introduzida no começo deste capítulo 
na discussão de três lançamentos de uma moeda com, digamos, p = 0,4. Então 
X tem a densidade discreta f dada por 


f(-3)20216; f(=1)=0,432; f(1)=0,288: ./f(3)- 0,064 


e f(x) = 0 se x € —3, — 1, 1, 3. Pode-se representar esta densidade por meio de 
> um diagrama como ilustra a Figura 1 


0,432 


0,288 
0,216 


0,064 
| с. | а ан 
; АП 


1 2 3 


Figura 1 


Exemplo 2. Distribuição binomial. Considere 7 repetições independentes de 
um experimento simples do tipo sucesso-fracasso discutido na Seção 1.5. Seja Sn 
o número de sucessos em n repetições. Então Sy é uma variável aleatória que 
pode assumir somente os valores 0, 1, 2, ..., п. Mostramos no Capítulo 1 que, 
para um número inteiro k,0O<k & n, 


PG, = 0 = (D) ra - prs 


portanto a densidade f de S, é dada por 


é n CBE г ^ 
foe (1) PE =  x-512...1 
0, para outros valores de x. 


Esta densidade, que está entre as mais importantes que ocorrem na teoria da proba- 
bilidade, chama-se densidade binomial de parámetros п e p. A densidade do 
> Exemplo 1 é uma densidade binomial de parámetros n —3 e p = 0,4. 
Refere-se freqüentemente a uma variável aleatória X, com densidade bino- 
mial, dizendo que X tem uma distribuição binomial (com parâmetros n e p 
quando se deseja ser mais preciso). Usa-se também fraseologia semelhante para 
outras variáveis aleatórias que tem designação específica. 


Como foi explicado no Capítulo 2, a distribuição binomial ocorre na amos- 
tragem aleatória com reposição. Na amostragem aleatória sem reposição, temos a 
distribuição discutida a seguir. 

Exemplo 3. Distribuição hipergeométrica. Considere uma população de r objetos 
dos quais r,, são de um tipo e 7 =r —r, são de um segundó tipo. Suponha 
que se extraia desta população uma amostra aleatória sem reposição de tamanho 
n<r. Seja X o número de objetos do primeiro tipo na amostra. Então X é uma 


variável aleatória cujos valores possíveis são 0, 1, 2, . . . , n. Dos resultados da 
Seção 2.4. sabemos que 
Ru. 
Р(х хус лл Le уо т 
F 
(1) 
Mas podemos escrever 
E r—rn 
Ax/ Vin — x) (dr ч) n! 
r xin =x) 00), 
n 
a (5 (Ur т) 
* (ғ), | 
Assim podemos escrever a densidade f de X de duas formas 
(z) ( — n) 
GA А recae чучо me 
fœ) = ( r) 
n 
0, outros valores de x 


ou 


п\ (rir — т)»-х EEN 5 
do pDEES 


0, outros valores de x 


Esta densidade chama-se densidade hipergeométrica. 
Apresentamos a seguir alguns exemplos mais de variáveis aleatórias. 
Exemplo 4. Variável aleatória constante. Seja c um número real. Então a função 
X definida através de X(w) = c para todo о é uma variável aleatória discreta, 
já que { w: X(w) = cj é todo o conjunto 9 е Q é um evento. Claramente 
Р(Х = с) = 1, de modo que a densidade f de X é simplesmente f(c)=1 e 
f(x) = 0, x + c. Esta variável aleatória chama-se variável constante. É sob este 
ponto de vista que uma constante numérica é considerada uma variável aleatória. 
Exemplo S. Variável aleatória indicadora. Seja 4 um evento. Faça X(w) = 1 
s c € A e X(w) = 0 se © A. Então o evento А ocorre se, e somente se, 
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dt 


si 


é: 


à 4 
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X = 1. Esta variável aleatória chama-se variável aleatória indicadora de А porque 
o valor de X, nos diz se o evento 4 ocorre ou não. 

Reciprocamente se X é uma variável aleatória em um espaço de probabilidade 
(О, 27 ,P), que toma o valor 1 ou 0, então X é a variável aleatória indicadora 
do evento. 


A | А = { о: Х(о) = 1}. 
Seja p = Р(Х = 1). А densidade f de X é dada por | 
f(0-21-p, /(1)=р е f(x)20 para х =0 ou 1 


Exemplo 6. Considere o seguinte jogo de azar. Divide-se um alvo circular de raio 

1 lem n zonas por meio de n discos concêntricos de raios 1/n, 2/п,...,п/п = 1, 
como ilustra a Figura 2 para o caso n = 5. Lança-se aleatoriamente um dardo 
ao alvo, e se ele atinge a zona anular entre os círculos de raios i/n e (i+ D/n, 
ganha-se i dólares, і = 0, 1, 2,...,п — 1. Seja X a importância ganha. Obtenha 
a densidade de X. 


Figura 2 


O espaço de probabilidade escolhido para este experimento será o espaço 
uniforme de probabilidade sobre o disco de raio 1. Claramente X é uma variável 
aleatória discreta neste espaço com os valores possíveis 1, 2, . . . , n. O evento 
А ={Х = п —i)ocorre se, e somente se, o dardo atingir a região limitada pelos 
círculos de raios i/n e (i + 1)/n. De acordo com a discussão de Seção 1.2., a pro- 
babilidade de 4 é a área de A dividida pela área do disco unitário. Assim para 
1D еа, 


P(X =n – i) 


А 
| 

3 

È 


Fazendo n — i = x, vemos que a densidade de X é 
2(n—x)41 
f(x) = n? ў 


0, para outros valores de x 
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А densidade f de uma variável aleatória discreta X tem as trés seguintes 
importantes propriedades: 

оу оек: 

(ii) (x: f(x) £ 0 | éum subconjunto finito ou infinito enumerdvel de К. 

Seja (X1,X2,... } este conjunto. Então 

(ш) Z;f(x;)- 1. 

As propriedades (i) e (ii) são imediatas da definição de função de densidade 
discreta de X. Para verificar (iii), observe que os eventos { w: X(w) = x; | são 
mutuamente disjuntos e sua união é О. Assim 


Y Хх) = ERX = x;) 


| 


Р (U (x = o) = P(Q) = 


Definição 3. Diz-se que uma função real f definida em R é uma função de 

densidade discreta desde que ela satisfaga as propriedades (1), (ii) e (iii) men- 

cionadas acima. | 

É fácil ver que qualquer função de densidade discreta é função de densidade 
de alguma variável aleatória X. Em outras palavras, dado f, podemos construir 
um espaço de probabilidade (S2,.27, Р) e uma variável aleatória X, definida em 
О, cuja densidade discreta é f. Realmente, suponha que f é dado e que 
(x1,x2,...) é o conjunto de valores onde f(x) == 0. Tome-se ( x1,X5,...) para 
€, todos os subconjuntos de О para .2/ e a medida de probabilidade definida em 
4 por P( co ) —f(xj) se w =x; para P. Então a variável aleatória X definida 
por X(w) = х; se w =x; é uma variável aleatória com as características expostas 


m 


acima. Isso pode ser constatado observado que { w: Х(о) =x; ) = (x; ) e assim 


O resultado acima nos garante que asserções como “seja X uma variável 
aleatória com densidade discreta f” sempre fazem sentido, mesmo que não 
especifiquemos diretamente o espaço de probabilidade sobre o qual X é definido. 
Para economia de escrita, usaremos doravante o termo densidade no lugar de den- 
sidade discreta até o final deste capítulo. 

A noção de variável aleatória discreta constitui um meio conveniente de des- 
crever um experimento aleatório que tem um número finito ou infinito enumerável 
de resultados possíveis. Não precisamos nos preocupar em estabelecer um espaço 
de probabilidade para o experimento. Em vez disso podemos simplesmente intro- 
duzir uma variável aleatória X que assuma os valores x,,x5,... tal que X = x; 
se, e somente se, o experimento conduz ao i-ésimo resultado. Assim, por exemplo, na 
extração aleatória de uma carta de um baralho com n cartas, podemos fazer X =i 
quando a i-ésima carta é extraída. Então Р(Х — i) — n^! , e poderíamos descrever 
o experimento dizendo que observamos uma variável aleatória X tomando os 


u 


ер 


valores inteiros 1, 2,...., п e tendo f(x) = n! рага х = 1, 2,...,п e f(x) = 0 
para outros valores de x сото sua função de densidade. 

Pode-se em geral descrever a realizacáo de um experimento que tem um пй- 
mero finito ou infinito enumerável de resultados possíveis como a observação do 
valor de uma variável aleatória discreta. Na realidade, muitas vezes esta é a forma 
como o experimento nos apresenta, e freqüentemente é mais fácil pensar no experi- 
mento nestes termos do que em termos de um espaco de probabilidade. 

Como ilustração dessa idéia, considere o experimento de selecionàr ao acaso 
um ponto do subconjunto S de R, consistindo dos pontos distintos x1,x2,.. ., X. 
Então a função f definida por 


STE A ARE Эр, NR TE 
ToU n para dee valores de © 
é claramente uma função de densidade discreta. Quando uma variável aleatória X 
tem esta densidade, dizemos que ela se distribui uniformemente em S. Observar 
um valor de X correspondente à noção intuitiva de escolher ao acaso um ponto de S. 
Apresentaremos agora mais duas densidades discretas que serão muito úteis 
na resolução de certas classes de problemas cuja importáncia se tornará aparente 
mais tarde. 
Exemplo 7. Densidades geométricas. Seja 0 < p < 1. Então a função real f 
definida em R por | 
gone H0 us xm ONIS 
nos "para outros valores de x. 


é uma função de densidade discreta chamada densidade geométrica de parâmetro p. 
Para ver que f é uma densidade, tudo que precisamos fazer é verificar se ela 
satisfaz a condição (iii), pois obviamente satisfaz as condições (i) e (ii). Mas (iii) 
decorre do gonna fato de que a soma da série geométrica 2.0 (1 — RE 
simplesmente p^! 
Exemplo 8. Densidades binomiais negativas. Seja œ um número real positivo 
qualquer e seja 0 < p < 1. Uma densidade intimamente relacionada com a geo- 
métrica é a densidade binomial negativa de parâmetros « e p definida por 


(1) f(x) = p in!) (-D*1-—p* -x2909,12..., 


0, para outros valores de x. 


Para mostrar que isto é uma densidade, devemos mostrar que (1) satisfaz as pro- 
priedades (i)—(iii). Obviamente a propriedade (ii) é satisfeita. Para ver que (1) 
satisfaz (i), observamos que para um número inteiro não-negativo x temos 


(4 _ (а), _ (—%(—«—1)-(—«—х+1) 


x x! $2 
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£ (—1 (aa + 1)---(@ + x — р 


x! 


=i (a + = D 
х. 
а+х— 
х 


= (17 ( 
Assim 
o  r(7)cva-»-r( 


QU LX 


') (= рӯ. 


Como o segundo membro de (2) é claramente não-negativo, vemos que (i) é verdadeiro. 
Para verificar (iii), lembre-se que a série de Taylor de (1 —7) ^ рага—1<г<1 é 


@) a-y*- E (lc. 


х= 


De (3) com t=1 —p vemos que 
a (а 
p= E (era - р 
x=0 


e portanto que У, f(x) = 1. 

De (2) vemos que podemos escrever a densidade binomial negativa na forma 
alternativa 
FIC qu x = 0,152, 0.0» 


(9 л = | 


рага outros valores de x. 
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Para alguns propósitos esta forma é mais útil do que a dada em (1). Observe que a 
densidade geométrica de parámetro p é a densidade binomial negativa de parámetros 
a=] e p. 
Exemplo 9. Densidades de Poisson. Seja А um nümero positivo. Define-se a 
densidade de Poisson de parámetro А através de 

ё 
ЈО) = | zi 


0, para outros valores de x. 


ОЕ 


Ё evidente que esta função satisfaz as propriedades (i) е (ii) de definição de função 
de densidade discreta. A propriedade (iii) segue-se imediatamente da expansão em 
série de Taylor da função exponencial, a saber, 
oo AT 
é=}. 
x=0 X! 
Sabe-se de experiência que muitos fenômenos aleatórios que envolvem con- 
tagem seguem aproximadamente a distribuição de Poisson. Alguns exemplos de 


== So po so АА НИМЕ ЧР Eu RE 


y 


tais fenômenos são o número de átomos de uma substância radioativa que se de- 
sintegram na unidade de tempo, o número de chamadas que chegam a uma central 
telefónica na unidade de tempo, o número de erros de impressão por página de um 
livro e o número de colônias de bactérias em um recipiente de petri untado com 
uma suspensão de bactérias. Um tratamento completo desses modelos requer a 
noção de processo de Poisson, que será discutido no Capítulo 9. 


3.2. CÁLCULOS COM DENSIDADES 

Até aqui restringimos nossa atenção à determinação de P(X = x). Freqüen- 
temente estamos interessados em determinar a probabtlidade de ( w: Х(о) € A] 
onde 4 é um subconjunto de R com mais de um ponto. 

Seja 4 um subconjunto de R е seja X uma variável aleatória discreta.tendo 


valores possíveis distintos xı, x3,.:. Então ( оо: X(w) € A ) é um evento. Para 
ver isso, observe que 
(5) {w | Х(о)є А} = U (ol X(o) = xj, 

хєА 


onde gu representa a união sobre todo valor de /, tal que x; € A. Geral- 
mente abrevia-se o evento ( w: X(w) € А} para (X € A) e representa-se sua 
probabilidade por Р(Х € A). Se —° &a «b €» e A ё ит intervalo com extre- 
mos em а e b, digamos А = (a, b], então geralmente escrevemos P(a < X < b) em 
vez de Р(Х € (a, b]). Usa-se notação semelhante para outros intervalos com estes 
pontos extremos. 

Usa-se também uma notação abreviada para probabilidades condicionais. 
Assim, por exemplo, se А е В são dois subconjuntos de R, escrevemos 
P(XEA | X € B) para a probabilidade condicional do evento ( X € A } dado 
o evento ( X EB). 

Seja f a densidade de X. Podemos determinar Р(Х € A) diretamente da 
densidade f por meio da fórmula 


(6) B ед) = У, fog. 


onde Уу, 4 representa a soma sobre todo ¿į tal que x; € А. Esta fórmula segue- 
se imediatamente de (5) já que os eventos { w | X(w) = xj), ї= 1, 2,..., são 
disjuntos. Geralmente abrevia-se o segundo membro de (6) рага Xy є д f(x). 
Em termos desta notação, (6) transforma-se em 


(7) РХ е4) = Y ft): 
хєА 


A função F(t), — 9» « [< ee, definida por 


TD = ве У Jf. — 09 = E < 00, 
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chama-se função de distribuição da variável aleatória X ou da densidade f. Segue-se 
imediatamente da definição de função de distribuição que 
P(a« X x b) = Р(Х < b) – Р(Х < a) = F(b) — F(a). 


Se X é uma variável aleatória inteira, então 

[t] 

Be X f 

onde [f] representa o maior inteiro menor ou igual a t (por exemplo, 
[2, 6] = [2] = 2). Vemos que F é uma função não-decrescente e que, para qualquer 
inteiro x, F dá um salto de magnitude f(x) no ponto x e F é constante no 
intervalo [x, x + 1). Propriedades adicionais das funções de distribuição serão 
obtidas de um ponto de vista mais geral no Capítulo 5. z 
Exemplo 10. Seja S = {1,2,...,10}eseja X uma variável aleatória uniforme- 
mente distribuída em S. Então f(x) = 1/10 para x 2 1,2, ...,10 e f(x)=0 
para outros valores de x. A função de distribuição de X é dada por F(t) = 0 
para £ & 1, F(t)=1 para t2 10 e 


F(f) = Ў лә = Ш. 16х10. 


O gráfico da função F(t) é dado na Figura 3. A probabilidade P(3 < X < 5) 
pode ser calculada como 
PO «€ Х = 5) = Да) + уо) =2/0 


ou como 
PG < X < 5) = F(5) — FQ) = 5/10 — 3/10 = 2/10. 


Analogamente P(3 € X < 5) obtém-se como 
РЗ<Х < 5) ^-f(Q)-f(4) + f(5) = 3/10 
ou como 


PB<X<)=PL<X<5 = Е(5) – FQ) = 5/10 — 2/10 = 3/10. 


P (X xt) 


жүз 


Pa 


e m NS QU 


Exemplo 11. Seja X uma variável aleatória com distribuição geométrica de pa- 
râmetro p. Obtenha a função de distribuição de X e determine P(X >x) para 
um número inteiro não-negativo de x. 

A densidade de X, de acordo com o Exemplo 7, é 
СЕНО ЕС 
outros valores de x. 


1— р)”, 
у= е 
Assim F(t)=0 para t «0 e 
[n] 
F() = М, р1- р, tz 


Usando a fórmula para a soma de uma progressáo geométrica finita, concluímos que 
Wyeg-qupm reu 
Em particular, para um inteiro não-negativo x, F(x — 1) = 1 — (1 —p)* e, portanto, 
РАХ >х=е = н Р(@Ш=х)=1—РШО< 5—1) 
= 1— Ё(х— 1) = (1 — р)^. 

Variáveis aleatórias com distribuição geométrica ocorrem naturalmente nas 
aplicações. Suponha que temos um componente de um equipamento, tal como 
um fusível elétrico, que não deteriora nem melhora com o passar do tempo, mas 
pode falhar devido a causas esporádicas e aleatórias que ocorrem homogeneamente 
no tempo. Suponha que se observe o objeto a intervalos fixos de tempo, tais como 
horas ou dias, e seja X o número de unidades de tempo até e inclusive a primeira 
falha, suponha que o objeto está novo no tempo O. Claramente X é uma variável 
aleatória discreta cujos valores possíveis são os inteiros 1,2,... O evento 
(X = n } ocorre se, e somente se, o objeto falha pela primeira vez no n-ésimo 
período de tempo. Pode-se formular precisamente a noção de que o objeto não 
deteriora nem melhora com o tempo da seguinte forma. Se sabemos que o objeto 
não falhou até o tempo п de modo que X >п, a probabilidade de que o objeto 
não falhe até o tempo n +m, isto é, P(X >n * m/X >n), deve ser igual a pro- 
babilidade de um objeto novo instalado no tempo п, não falhar até o tempo n * m. 
Pode-se tomar o fato de que as causas da falha ocorrem homogeneamente no tempo 
como significando que esta probabilidade depende apenas do número de intervalos 
que decorrem entre n e n +m, isto é, m, mas não de n. Assim P(X >п) deve 
satisfazer a equação 


(8) P(X nube = п) = Р(Х т). 


Uma vez que 


ре асан и pa td n 
P(X > n) 
podemos reescrever (8) como 
(9) PIX = n em) = P(X unm) ПОПЕО Е 
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Fazendo п = т = 0 vemos que P(X > 0 = Р(Х > 0}, de modo que P(X > 0) 
é igual a 1 ou 0. Se P(X > 0) = 0, então Р(Х = 0) = 1, o que é impossível no 
nosso caso já que .X pode assumir somente valores inteiros positivos. Portanto 
Р(Х » 0) = 1. 

Fazendo p = Р(Х = 1), de modo que P(X > 1) = 1 —p, vemos de (9) que 


P(X » п + 1) = (1 – рР(Х > n). 
Por iteração sobre и segue-se que Р(Х >п) = (1 р)". Assim para n = 1, 2,..., 
d occu ЕВО + = у DSO) | 
0 руф ру" 


Se р = 0, então Р(Х = п) = 0 рага n = 1, 2,... eassim Р(Х = +оо) = 1, 
isto é, o objeto nunca falha. Nós excluímos este caso de consideração. Da mesma 
forma excluímos p = 1 porque neste caso Р(Х = 1) = 1, eo objeto sempre falha 
no primeiro período de funcionamento. 

Seja Y = X — 1. Então Y assume os valores 0, 1, 2,... com probabili- 
dades P(Y = n) = p(1 — р)". Vemos portanto que Y tem distribuição geométrica 
de parámetro p. 

Como acabamos de mostrar, a variável aleatória Y — X — 1 distribui-se geo- 
metricaménte. Este exemplo é típico no sentido de que variáveis aleatórias com 
distribuição geométrica ocorrem geralmente em relação ao tempo de espera até a 
ocorréncia de algum evento. Este fato será discutido mais detalhadamente depois 
de tratarmos das repetições independentes de um experimento na Seção 3.4. 


3.3. VETORES ALEATÓRIOS DISCRETOS 


Acontece, frequentemente, estarmos interessados em estudar a relação entre 
duas ou mais variáveis aleatórias. Assim, por exemplo, na extração de uma amostra 
aleatória de tamanho п de uma caixa, contendo r bolas, numeradas de 1 a r, 
poderíamos desejar saber qual o número mais alto Y ou o número mais baixo Z 
observado entre as bolas selecionadas. 

Seja (92,.4, Р) um espaço de probabilidade e sejam X,,X,,...,X, Р variá- 
veis aleatórias discretas definidas neste espaço. Então para cada ponto w € Q 
cada uma das variáveis aleatórias X,,...,X, assume um de seus valores possíveis, 
fato que será indicado escrevendo 


Xi(w) = ху, Xw) = x2,..., 0) = x. 


Em vez de pensar em observar r números reais x,,X5,...,X,, podemos pensar em 
observar uma r-tupla x = (x1, X2,...,X,), onde para cada i, x; é um dentre o nú- 
mero finito ou infinito enumerável de valores que a variável aleatória X; pode assumir. 


Seja R” a coleção de todas as r-tuplas de" números reais. Um ponto 
x=(x,...,x,) de В” é habitualmente chamado de vetor r-dimensional. Assim, 
para cada c € Q, os r valores X4(c),...,X,(c) definem um ponto 


Х(о) = (X,(o), Х›(®),..., X, (o) 


de R”. Isto define uma função vetorial r-dimensional em Q, X: €) > К”, que se 
representa habitualmente por X = (X4, X2, ..., X,). A função X é chamada 
de vetor aleatório discreto r-dimensional. 

Acabamos de definir um vetor aleatório r-dimensional em termos de r variáveis 
aleatórias reais. Alternativamente, pode-se definir üm vetor aleatório r-dimensional 
diretamente com a função X: О > К”, estendendo quase literalmente a definição 
de uma variável aleatória real. | 

Definição 4. Um vetor aleatório r-dimensional X, é uma função X de 
Q para А”, assumindo um número finito ou infinito e numerável de valores 
X1,X2,... tais que 


(o: X(w) = xij) 


é um evento para todo i. 
Define-se a função de densidade f de um vetor aleatório -X através de 


Pesa у = Р(Х, = X oe AL = o) 


ou equivalentemente - 
Te) = PX = х), xeR. 


Pode-se determinar a probabilidade de que X pertença ao subconjunto A 
de R” usando o análogo de (7), a saber, 


P(X e А) = » f(x). 


Como no caso unidimensional, a função f tem as seguintes propriedades: 

(MIC) OXER. . 

(ii) (x: f(x) = 0 } é um subconjunto finito ou infinito enumerável de К’, 

que será representado por ( xi, Xa, ...). 

(iii) Z; f(x;) = 1. 

Qualquer função real f definida em К”, que tem estas três propriedades, 
será chamada de função de densidade discreta r-dimensional. O argumento apre- 
sentado para o caso unidimensional aplica-se literalmente para mostrar que qualquer 
função de densidade discreta r-dimensional é função de densidade de algum vetor 
aleatório r-dimensional. 

Existe uma terminologia tradicional associada com vetores aleatórios e suas 
fonções de densidade Seja X=(X,,X,,...,X,) um vetor aleatório r-dimensional 
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com densidade f. Então a função f é habitualmente chamada de função de den- 
sidade conjunta das variáveis aleatórias X 1, X2, ..., Ху. A função de densidade 
da variável aleatória X; é então chamada de i-ésima densidade marginal de X ou de f. 

Sejam X e Y duas variáveis aleatórias discretas. Para quaisquer números 
reais х e y, o conjunto ( о | X(w) = х e Y(w) = y ) é um evento, que será 
representado por ( X = x, Y = y ). Suponha que os valores possíveis distintos 


de X sejam x,,x2,... eos de Y sejam y1, Y2, ... Рага cada x, os eventos 
(X2x,Y-yjl j=1,2,..., são disuntos e sua união é o evento ( X =x). 
Assim 


P(X = х) 


Р (U X=xY= Р) 


Ш 


у 


Ух хуу) = КЕСКЕ 
J = 


Esta última expressão resulta do uso da mesma convenção notacional introduzida 
para variáveis aleatórias na Seção 3.2. 
Analogamente, 


PIT = qa 


Em outras palavras, se conhecemos a densidade conjunta de duas variáveis aleatórias 
discretas X e Y, podemos obter a densidade fy de X somando sobre y e,a 
densidade fy de Y somando sobre x. Assim em termos das densidades, se f 
é a densidade conjunta de X e Y, então 


(11) ло) = Y f(x, у) 
е 
(12) fO = X fx, y). 


Exemplo 12. Suponha que se extraia aleatoriamente, sem reposição, duas cartas 
de um baralho de 3 cartas numeradas de 1 a 3. Seja X o nümero da primeira carta 
e Y o da segunda. Então a densidade conjunta de X e Y é dada por 
fü, 2) = ДІ, 3) = f(2, 1) = f(2, 3) = f(3, 1) = f(3, 2) = 1/6 e f(x, у) = 0 para 
outros pares de x e y. A primeira densidade marginal, isto é, a densidade de X 
é dada por /у(1)=/(1,1)+/(1,2)+/(1,3) 2 0+ 1/6 + 1/6 = 2/6 = 1/3 e similar- 
mente para x = 2e3. Portanto fy(x)= 1/3,x=1,2,3,.e fy(x) = O para outros 
valores de x, como era de se esperar. 

Exemplo 13. Suponha que X e Y são duas variáveis aleatórias que assumem os 
valores de x e y, onde x=1,2 e у= 1, 2, 3, 4, com as probabilidades dadas 
na tabela abaixo. 
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Então fy) = Li: MD) = MA * 18 + 1/16 + 1/16 = 1/2, e 


fx(2 = 1-fx(1) = 1/2 de modo gue X tem distribuição uniforme sobre 1 e 2. 
Analogamente 
fy (1) = 1/4 + 1/16 = 5/16, fy(2) = 3/16, fy (3) = 5/16, fy (4) = 3/16. 


3.4. VARIÁVEIS ALEATÓRIAS INDEPENDENTES 


Considere o experimento de lançar uma moeda e um dado. Acreditamos 
intuitivamente que o resultado do lançamento da moeda, qualquer que seja ele, 
não deve ter influência sobre o lançamento do dado, e vice-versa. Desejamos cons- 
truir um modelo de probabilidade que reflita essas idéias. Seja X uma variável 


aleatória que é 1 ou 0, dependendo de se o lançamento da moeda resulta em cara 


ou coroa, isto é, o evento { X = 1) representa o resultado de se observar cara e о 
evento ( X = 0) о de se observar coroa. De forma semelhante representamos о 
resultado do lançamento do dado por uma variável aleatória Y que assume o valor 
1,2,... ou 6 dependendo de, se o número observado no dado é 1, 2,... ou 6. 
Pode-se representar o resultado do experimento composto através do vetor alea- 
tório (X, Ү). A noção intuitiva de que os resultados observados, na moeda e no 
dado, não têm influência um sobre o outro pode ser traduzida, precisamente dizendo, 
que se x é um dos números 1 е Ое у é um dos números 1, 2, . ... , 6, então os 
eventos ( Y = x е ( X = y) devem ser independentes. Assim o vetor aleatório 
(X, Y) deve ter a densidade conjunta f(x, y) dada por 


P(X-xJNY-y, x-0,4, y=1,2,...,6, 


foy) = 0, outros valores de x e у. 


Em outras palavras, a densidade conjunta f de X e Y deve ser dada por 
f(x, у) = 1x0) fvO). 
Definição 5. Sejam X,, X2,..., X, r variáveis aleatórias discretas tendo 


as densidades f,,f2,...,fr, respectivamente. Diz-se que estas variáveis aleatórias 
são mutuamente independentes se a sua função de densidade conjunta f é dada por 


[7] 


о 


(13) fG x. esu) = (х1) fa(xo) ++. fo). 


Diz-se que as variáveis aleatórias são dependentes se elas não forem indépendentes. 
Como no caso do experimento composto de lançar uma moeda e um dado, a noção de 
variáveis aleatórias independentes constitui uma forma conveniente de formular pre- 
cisamente a noção intuitiva de que os experimentos são independentes uns dos outros. 
Considere duas variáveis aleatórias independentes com densidades fy e fy, 
respectivamente. Então para dois subconjuntos quaisquer 4 e B de R. 


(14) P(XEA,YEB)=P(XEA)P(YEB). 
Para verificar (14), observe que ^ 
Р(Х єА, Ye B) = У Sax, у) 
xeA уен 
= FOI) 
xeA yeB 
= | >, e| | v, ^| 
xeA yeB 
= P(X e А)Р(Ү e B). 
A fórmula (14) acima estende-se facilmente de 2 para r variáveis aleatórias inde- 
pendentes. Assim, se 4,,442,... Ar são r subconjuntos quaisquer de R, então 
(15) Р(Х, €A,,..., X, € Aj - P(X, €A)---PX, € Aj). 
Exemplo 14. Sejam X e Y duas variáveis aleatórias independentes com distri- 
buição geométrica de parámetro p. 
(a) Determine a distribuição de min ( X, Y). 
(b) Determine P(min(X, Y) = X) - P(Y > X). 
(c) Determine a distribuição de X + Y. 
(d) Determine P(Y =y | X + Y 2z) para y = 0, 1,...,2. 
Para resolver (a), observamos que para um inteiro não-negativo 2 
P(min(X, Y) 22) - P(X2z,Y >z) - P(X2z) P(Y2z), 
de modo que, pelo Exemplo 11 
P(min (X, Y) 2 z) = (1 - p)*0 -p)* = ( - py*. 
P 


Segue-se do Exemplo 11 que min (X, Y) tem uma distribuição geométrica de 
parâmetro 


1-(1-р)? =2р-р?. 
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Para resolver (b), observamos que 
Hr EMNE-C.Y-exXx) 
а РҮ = Ух х) 
=0 


Х)Р(Ү.> x) 


I 
х 
itas 
au 
ы 
Ш 


= Ў ра - р? 


+ P 
"ph dae 
= р/(1 — (1 — p) = р/(2р — p^. 
Para resolver (c), seja z um inteiro não-negativo. Então 
PX+Y=)= У Р(Х=х,Х+Ү =з) 
х=0 
= Y P(X —x,Y-—z-—x) 
x=0 
= > Р(Х = WAY =2=%) 
x=0 i 
e 1 cmm 
= (z t Dp — py. 
A solução de (d), é dada por 
BY ya uua ШОЛА TIO 
Р(Х 4 Y = 2) 
1 q eds nd» 
Р(Х + Ү= 2) 
_ PX =z -PO = у) 
Р(Х.+Ү = 2) 
À 


HED Po = р)” 
(2 + 1)р'(1 — př 
1 

ег 
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Considere um experimento (tal сото o lançamento de um dado) que tec 
somente um número finito ou infinito enumerável de resultados possíveis. Então. 
como já foi explicado, podemos pensar neste experimento como a observação do 
valor de uma variável aleatória X. Suponha que o experimento seja repetido л 
vezes. Pode-se descrever o experimento composto como a observação dos valores 
das variáveis aleatórias X,, X5, ..., X,, onde X; é o resultado do i-ésimo expe- 
rimento. Repetindo-se os experimentos sob condições idênticas, presumivelmente o 
mecanismo de chance permanece o mesmo, de modo que devemos exigir que estas п 
variáveis aleatórias tenham a mesma densidade. Pode-se agora formular a noção 
intuitiva de que os repetidos experimentos não têm influência uns sobre os outros, 
exigindo que as variáveis aleatórias X,, X,,..., X, sejam mutuamente indepen- 
dentes. Assim, em resumo, pode-se usar n variáveis aleatórias independentes, com 
densidade discreta f para representar n repetições de um experimento, tendo um 
número finito ou infinito enumerável de resultados possíveis. 

Os experimentos aleatórios mais simples são, aqueles que têm apenas dois 
resultados possíveis, que podemos designar de sucesso e fracasso. No lançamento 
de uma moeda, por exemplo, podemos pensar na obtenção de cara como sucesso, 
enquanto na extração de uma carta de um baralho podemos considerar a obtenção 
de um ás como sucesso. Suponha que realizamos n repetições do nosso experimento 
simples. Então podemos descrever a situação supondo que X,,X,,...,X, são 
n variáveis aleatórias indicadoras tais que X;=1 ou O dependendo de se a i-ésima 
repetição do experimento resulta em sucesso ou fracasso. Na literatura, provas que 
podem resultar em sucesso ou fracasso são chamadas de provas de Bernoulli , e 
descreve-se a situação acima dizendo que realizamos п provas de Bernoulli com 
probabilidade comum de sucesso p = P(X; = 1). Neste contexto diz-se que uma 
variável aleatória que assume os valores 1 e 0, com probabilidades p e 1 — p, 
tem uma densidade de Bernoulli de parámetro p. 

O resultado da realização de n provas de Bernoulli pode ser representado 
pelo vetor aleatório X = (X4, X5, .. ., Xn). A informação contida neste vetor 
diz exatamente quais são as provas que resultaram em sucesso e quais resultaram 
em fracasso. Frequentemente não se requer uma informação tão precisa, e tudo 
que desejamos conhecer é o número de sucessos $, obtidos em n provas. 
Mostramos no Exemplo 2 que 5, se distribui binomialmente com parâmetros 
n e p. Observe que S, = X, + Х +... + Xpy. Pode-se pensar em qualquer 
variável aleatória que se distribui binomialmente com esses parâmetros como sendo a 
soma de n variáveis aleatórias independentes de Bernoulli, cada uma com parâmetro p. 

Consideremos agora as repetições independentes de um experimento que tem 
um número finito r 2 2 de resultados possíveis. 


3.4.1. A DISTRIBUIÇÃO MULTINOMIAL. Considere um experimento, tal como 
o lançamento de um dado, que pode resultar em somente um número finito r de 
distintos resultados possíveis. Podemos representar este experimento dizendo que 


observamos uma variável aleatória Y que assume os valores 1, 2,..., г, de modo 
que o evento ( Y = i } representa o fato de que o experimento produziu o i-ésimo 
resultado. Seja р; = P(Y = i). Se realizamos n repetições independentes do 
experimento, podemos representar o resultado dessas п provas por meio de um 
vetor aleatório n-dimensional (Y;,..., Y,), onde a variável aleatória Y; corres- 
ponde a j-ésima prova. Aqui as variáveis aleatórias Y,,..., Y, são mutuamente 
independentes e P(Y; = i) = pj. 

O vetor aleatório (Y,,..., Ү„) nos dá o resultado de cada uma dessas 
n provas. Como no caso de r = 2 resultados, frequentemente não estamos inte- 
ressados numa descrição tão detalhada, mas gostaríamos de saber apenas quantas 
das n provas conduziram a cada um dos diversos resultados possíveis. Seja 
Xj i=1,2,...,r, o número de provas que produzem o i-ésimo resultado. 
Então X; = x; se, e somente se, exatamente x; das n variáveis aleatórias 
Y,,..., Y, assumem o valor i, isto é, exatamente x; das n provas produzem 
o i-ésimo resultado. a 

Por exemplo, para r=3 e n — 5, se 


Ү,=2,Ү, =3, Y; =3,Ү, = 2, e Ys = 2, 
então 


X, =0, X, =3, e Хз = 2. 


А seguir determinaremos a densidade conjunta de X,,...,X,. Para isso, 
sejam X1,X2,...,Xy r números inteiros não-negativos tais que x4 t --- t x,— n. 
Como as variáveis aleatórias Y,, Y2,..., Y, são independentes e têm densidade 
comum, um pouco de raciocínio mostra que cada escolha específica x; delas 
tendo valor 1, x, delas tendo valor 2,...,x, delas tendo valor r tem a mesma 
probabilidade que é 


à PR a e XE 
pip Pr . 
Assim, representando por C(n; xi, ... , Xr) o número de escolhas possíveis, 
vemos que 


Р(Х, Е UNE хур p. 


A determinação de C(n;x,,...,x,) é um problema de análise combinatória que 
se pode resolver facilmente pelos métodos do Capítulo 2. A maneira mais simples 
b de fazê-lo é pensar nos r valores 1,2,...,r como r caixase nas n provas como 

n bolas. Então С(п; ху, ..., х) é o número de maneiras em que podemos 

distribuir n bolas em r caixas de modo que tenhamos exatamente xı, bolas 

na caixa 1,..., exatamente x, bolas na caixa r. Se assim for feito, a caixa 1 

terá x, bolas. Estas x, bolas poderão ser escolhidas dentre л bolas de 


о 


dá maneiras. As n — x, bolas restantes estarão distribuídas nas r — 1 caixas 
1 


2,3,...,r de modo que teremos x, bolas na caixa 2,...,x, bolas na caixa r. 
Assim 


(16) Сеад (а) C(n —x1:X3. 55 X») 


Segue-se por indução sobre п que 


n! 


(17) G(n Ху... Xp) = DCD) 


Realmente, para r = 1 não há nada a demonstrar. Suponha que (17) seja verdadeiro 
para r — 1 caixas. Então de (16) vemos que 


n! n — x4)! 
С(п; х1,...,х,) = (х\!)(п — ху)! би 
é аы, оса 
= (ху!)---(х„!) 


como desejado. 
Portanto a densidade conjunta f de Х;,..., X, é dada por 


n! Xi... Xr 
ГҮ "Г и Pr * 
x,!)---(x! 
(18) fO.) = : a СЕ 2 = 
x; inteiros > Otaisque x, +---+x,=n, 
0, outros valores de x; 


Esta densidade chama-se densidade multinomial de parámetros n e р; ...,р,. 

Observamos de imediato que as variáveis aleatórias X,,...,X, não são 
independentes. De fato, como X; + X; +... + X, = n, quaisquer ғ — 1 delas 
determinam a résima. Usa-se às vezes esse fato, juntamente com a relação 
Pı +t- -- +p, = 1, para expressar a distribuição multinomial de uma forma dife- 
rente. Sejam x1, X2, ... ,Xr—1ı;7ř— 1 números inteiros não-negativos tais que 
x, tt x, 4. <n. Então; 


(19) Р(Х, = x,..., X,-1 = х,-1) 
n! 
d Quy e EP 


x muepcmeceeem&.g' 7 e 


Esta forma é conveniente quando estamos interessados nos primeiros r — 1 resul- 
tados e pensamos no r-ésimo resultado como o resultado que é “nenhum dos 
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r — 1 resultados". Assim, no lançamento de um dado poderíamos estar interes- 
sados em saber se ocorrem 2, 4 ou 6. Então o experimento teria quatro resultados 
possíveis “2”, “4°, “6° e “não é(2, 4 ou 6)”. 

Seja k um número inteiro não negativo, К < r. Um simples argumento 
probabilístico mostra que para números inteiros não-negativos X;, X2,...,Xk 
tais que x; *---txy < n, 


(20) Р(Х, = S ee Ak = хк) 
п! 


GD Dn — Ga ++ x)]! 
LI X p pe — (р ++ ptem) 


Para ver isto, observe que na realização das n provas estamos agora interessados 
somente nos (k + 1) sresultados» О SES e staos(19 25 s E) 
Assim, em essência temos n repetições de um experimento tendo k + 1 resultados, 


com X; sendo o número de vezes que ocorre o i-ésimo resultado, i = 1,2,...,k. 
A equação (20) decorre então de (19) com r — 1 =k. 


3.4.2 APROXIMAÇÃO DE POISSON PARA DISTRIBUIÇÃO BINOMIAL. 

Existe uma importante ligação entre a distribuição binomial e a de Poisson. 
Suponha por exemplo que realizamos n provas de Bernoulli com probabilidade 
de sucesso p, = A/n em cada prova. Então a probabilidade de obter 5, = К 
sucessos nas n provas é dada por 


PCS, = 19 = (5) са р 


_ 2 (п), (1 з a (a s D 
К! n* n T EN 
a medida que n > о, (n)y/n* ^ 1, (1 — Мп)" ^ е^, e(1— Nn)-* > 1. 
Conseqüentemente, 


Q1) lim (p) Go — pt = ze 


Na derivação de (21) tínhamos np, = A. Na realidade (21) é válido sempre que 
пр, > À quando n eo, 

› Usa-se a Equação (21) nas aplicações para aproximar a distribuição binomial 
pela distribuição de Poisson quando a probabilidade de sucesso p é pequena e 
n é grande. Faz-se isso aproximando a probabilidade binomial P(S, = x) por 
meio de f(x), onde f é a densidade de Poisson de parámetro А = np. A apro- 
ximação é bastante quando np? é pequeno. O exemplo seguinte ilustra essa técnica. 
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Exemplo 15. Uma máquina produz parafusos dos quais 19 são defeituosos. Deter- 
mine a probabilidade de que não haja parafusos defeituosos numa caixa de 200 
parafusos. 

Temos aqui n = 200 provas de Bernoulli com probabilidade de sucesso 
р = 0,01. A probabilidade de que não haja parafusos defeituosos é 


(1— 0,01)2% = (0,99)29 = 0,1340. 
A aproximação de Poisson para esta probabilidade é dada por 


е 20000,01) — „—2 — 0 1353. 


O fato de que a distribuição de Poisson pode ocorrer como o limite de distri- 
buições binomiais tem importantes conseqüéncias teóricas. É uma das justificativas 
para desenvolver modelos baseados em processo de Poisson, que serão discutidos 
no Capítulo 9. O uso da aproximação de Poisson como artifício para poupar tra- 
balho na determinação de probabilidade binomial tem importância secundária, 
uma vez que se pode calcular facilmente as próprias probabilidades binomiais. 


3.5. SEQÜÉNCIAS INFINITAS DE PROVAS DE BERNOULLI 


Considere a realização repetida de um experimento do tipo sucesso-fracasso 
com probabilidade de sucesso p até que ocorra o primeiro sucesso. Para qualquer 
número predeterminado п de provas, existe a probabilidade não-nula (1 — p)" 
de que não ocorra nenhum sucesso. Assim, considerando o número de provas até 
o primeiro sucesso, não podemos nos limitar a qualquer número predeterminado 
de provas mas, considerar uma sequência interminável de provas. 

Um dado número finito n de provas constituem n provas de Bernoulli, 
representadas por n variáveis aleatórias independentes de Bernoulli X,,...,X,. 
Para representar uma seqüéncia infinita de provas de Bernoulli consideramos uma 
seqüéncia infinita (X, ), n > 1, de variáveis aleatórias independentes de Bernoulli 
tendo o mesmo parâmetro p. : 

Em geral diz-se que as variáveis aleatórias X,, X5, .. . são independentes 
se as variáveis aleatórias X,, .. . , X, forem mutuamente independentes рага 
qualquer número inteiro positivo п. Pode-se mostrar que dada uma densidade 
discreta qualquer f, existe um espaço de probabilidade (92,.4,P) no qual estão 
definidas as variáveis aleatórias mutuamente independentes X,, X,,... com den- 
sidade comum f. 

Como modelo para a realização de uma sequência ilimitada de Bernoulii 
tomamos, portanto, uma seqüéncia infinita (X, ) , п > 1, de variáveis aleatórias 
de Bernoulli mutuamente independentes tais que Р(Х, = 1) = p, и 2 1. Inter- 
pretamos X, = 1 como significando que a n-ésima prova resulta em sucesso e 
X. = 0 significando que ela resulta em fracasso. 


| 


V 


ааа: сайа... 


Considere o número de provas W, até o primeiro sucesso. A variável alea- 
tória W, pode assumir somente os valores inteiros 1, 2,... O evento { W; =n} 
ocorre se, e somente se, as primeiras п — 1 provas são fracassos e a nésima prova 
é um sucesso. Portanto 


(W=en)=1X=0,...,. X, 1 70, X, = 1). 


Segue-se que 
PW; —HH)—P(X,-—0,...,X3,.-,-0,;X,-— 1) 
=Р(Х, = 0) Фа PX, 1 = 0) Р(Х, = 1) 
= 1 = pyt= p. 
Conseqüentemente 
(22) Р(И 5 19 E) BEL p 


Assim, W, — 1 distribui-se geometricamente com parámetro p. 

Seja r > 1 um número inteiroe 7, o número de provas até o r-ésimo sucesso 
(de modo que r-ésimo sucesso ocorre na prova T,). Então T, é uma variável 
aleatória que pode assumir somente os valores r, r+ 1, ... O evento { Т, =n} 
ocorre se, e somente se, ocorrer um sucesso na n-ésima prova e ocorrem exatamente 
ғ — 1 sucessos nas primeiras п — 1 provas. Assim 


И ОЕ eum 


Como os dois eventos do segundo membro são independentes е X, +... * X, , 
tem distribuição binomial de parámetros n — 1 e p, vemosqueparan=r,r+1,... 


Püt-qa PUE uc xL edo ME = I) 
- C E 1) Р (1 — pp 
- eire Куш 
Conseqüentemente 
Q3) нт, -r-n-( tira». 


Vemos das equações (4) e (23) que T, — r tem distribuição binomial negativa 

| de parámetros а =r e p. 
Seja Ty = 0 e T, a variável aleatória definida acima para qualquer número 
inteiro r > 1. Defina W; = T; - Tj ,,i—1,2,... Então №; éonümero de provas 


até о i-ésimo sucesso, após o (i — 1) i-ésimo sucesso. Mostraremos a seguir que, para 
qualquer número inteiro rZ 1, as variáveis aleatórias И, — 1, И, —1,...,W,—1 
s&o mutuamente independentes e tém a mesma densidade geométrica de parámetro p. 

Para tanto, sejam п}, пз, ..., п; r números inteiros positivos quaisquer. 
Então o evento { W, = n,,..., Wp = n, ) ocorre somente se todas as primeiras 
nj *---*mn, provas são fracassos, exceto as provas 


Ni Ni Enare АОС 


que são sucessos. Como as provas são mutuamente independentes com probabilidade 
comum de sucesso p, vemos que 
РОИ о И =л) =(1= рур apro pret = pj ta 


= f oa - р" 


Assim as variáveis aleatórias №, — 1,..., №, — 1 são independentes e distribuem-se 
geometricamente com parâmetro p. 

Vemos claramente que 7, — r = (№, — 1) +---+(W, — 1), de modo que 
Т. —r é a soma de r variáveis aleatórias independentes geometricamente distri- 
buídas. Mostramos anteriormente que 7, — r tem distribuição binomial negativa 
de parámetros r e p. Fica assim estabelecido o fato interessante e importante de 
que a distribuição da soma de r variáveis aleatórias geométricas independentes 
identicamente distribuídas com parâmetro p tem distribuição binomial negativa 
de parâmetros r e p. 

Propriedades adicionais de seqüéncias infinitas de provas de Bernoulli serão 
tratadas nos exercícios. 


3.6. SOMA DE VARIÁVEIS ALEATÓRIAS INDEPENDENTES 


Nesta seção discutiremos métodos para determinar a distribuição da soma 
de um número finito de variáveis aleatórias discretas independentes. Começamos 
considerando duas de tais variáveis aleatórias, digamos X e Y. 

Suponhamos então que X e Y são variáveis aleatórias discretas independentes. 
Sejam x,,X5,... Os distintos valores possíveis de X. Para qualquer z, o evento 
(X + Y =z ) é o mesmo que o evento 


UX ех у= рх 
Como os eventos { X = xj, Y = z — xj } são disjuntos para valores distintos de i, 
segue-se que 


РХ О PQX = ox, Y mmo x) 


= нк 


i 


x)P(Y = z — х) = > fx(xofy(z — x). 


area 


Em outras palavras, 
(24) /х+ү(@) = У fef y(z — х). 


Se X e Y são variáveis aleatórias inteiras, então X + Y é também inteira. 
Neste caso podemos interpretar (24) como sendo válida, quando z é inteiro e a 
variável x do segundo membro se estende sobre os (24) inteiros. Uma particula- 
rização adicional é útil. Suponha que X e Y assumam somente valores inteiros 
não-negativos. Então X + Y também assume somente valores inteiros não-negativos. 
Se z é um número inteiro não-negativo, então fy(x) fy(z — x) = 0 a menos que 
x seja um dos valores 0, 1,...,z. Então sob essas condições podemos reescrever 
(24) como 


Q5) fae) = Ў, RE- х) 


Embora a equação (25) seja útil na determinação da densidade de X + Y, 
geralmente é mais simples usar funções geratrizes de probabilidade. Descreveremos 
a seguir tais funções e apresentaremos diversas aplicações importantes de seu uso 
na determinação da densidade de soma de variáveis aleatórias independentes. 


Definição 6. Seja X uma variável aleatória inteira não-negativa. Define-se 
função geratriz de probabilidade Фу de X como 


00 = È PA = де Y (3) ya - ру", 


x=0 х= 
A seguir determinaremos y(t) para três casos específicos. 


Exemplo 16. Distribuição binomial. Seja X uma variável aleatória tendo distri- 
buição binomial de parâmetros n e p. Então 


PX = 3 = (2) ra - »7 
e portanto 


Q4( = Y РХ =)=] hd”, -1stsi 
x-0 x-0 
Pela fórmula de expansão binomial 
аку У (er, 
: х=о WX 
concluímos que i i 
(26) Фу(т) - (pt t 1—p)". 


Exemplo 17. Distribuição binomial negativa. Seja X uma variável aleatória 
com distribuição binomial negativa de parámetros а e p. Então 


Р(х= ә) =р“ (7) (Аа р) 


~ 
w 
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e portanto | 


od) = Y (72) еа - »e 
a vo к=; х 
=" (С) - рю 
х=0 
Da expansão em série de Taylor i 
rg s (9) $5 
x=0 х 
com 5 =—[(1— p), segue-se que 
od) = (—>? =. 
(27) x(t) бс ey 


Exemplo 18. Distribuição de Poisson. Suponha que X tem uma distribuição 
de Poisson de parámetro À. Então 


e portanto 


ao $ 
e = x E | 
x=0 x! 
vemos que 
(28) dy(t)=eMe-A = eG - 1), 


Sejam X e Y duas variáveis aleatórias independentes, inteiras e não-negativas. 
Então 


(29) Dy+y(t) = Dy(D)Py(t). 


Para verificar este resultado, observe que em virtude de (25) 


Фу у У Ao 


z-0 x-0 
= Y AQ 2: fdz — xjt* 


E 
ll 

© 

N 


x 


Il 


ips 
У 
= 


Y AG) Y 
x=0 у=0 


(t), 


ll 


que é o resultado desejado. 


bo a 


-— 


De (29) segue-se facilmente por indução que se X,, .. . , X, são variáveis 
aleatórias independentes, inteiras e não-negativas, então 


(30) By a. (oy caio, 


Pode-se demonstrar mais facilmente as conclusões do teorema seguinte usando 
a "técnica da funcáo geratriz", que se baseia no fato de que se 


oo oo 
Aiat X Ne -1<1<1, 
х=0 х=0 


então podemos igualar os coeficientes de t* nas duas séries de potência e concluir 
que dy = bw, х —0,1,2,... Isto mostra que se duas variáveis aleatórias inteiras 
e não-negativas têm a mesma função geratriz de probabilidade, elas devem ter a 
mesma distribuição. Em outras palavras, a função geratriz de probabilidade de uma 
variável aleatória inteira não-negativa determina unicamente a distribuição desta 
variável aleatória. 


Teorema 1. Sejam X,,...,X, variáveis aleatórias independentes. 

(i) Se X; tem distribuição binomial de parámetros n; e р, então 
X, +--+ X, tem distribuição binomial de parámetros n, +.. -+ n,e p. 

(ii) Se X; tem distribuição binomial negativa de parâmetros o; e p,então 
X, +... + X, tem distribuição binomial negativa de parâmetros 


e oye p. 
(iii) Se X; tem distribuição de Poisson de parámetro A;, então X, +... +X, 
tem distribuição de Poisson de parámetro à, +---+A,. 
Demonstração de (1). Se os X; são como especificados em (i), então pelo 
Exemplo (16) 
Фу, O, = $y (1) o" Фу (t) 
-(pttl-—p)-.-(pt*1—p)" 
=(pt +1-—р)т ++, 
Assim a função geratriz de probabilidade de X, +---+X, é igual à de uma variável 


aleatória com distribuição binomial de parámetros п, + ---+n, e p. Isto implica 
que X,+---+X, deve ter esta distribuição binomial. Pois suponha que 


Metade ИЕ MAE CSS NS 
а, = ('! 4 )ra - p» n 


sejam as probabilidades binomiais correspondentes. Entáo 
Y Р(Х, coco Х, = x) = Фу +... +х,(0) 
х=0 
С = ру = 


oo 


xx c ca pt 


x=0 


Assim, igualando os coeficientes, vemos que 
Р(Х, +... +X,=x) — dx 


e portanto que X, +... + X, distribui-se binomialmente conforme estabelece (i). 


Demonstração de (ii) Se os X; são como especificados em (ii), então pelo 
Exemplo 17. 


Oy ++ x (D) = Ox, oo Px) 7 
url c 


Assim a função geratriz de probabilidade de X,+---+X, é igual à de uma variável 
aleatória com distribuição binomial negativa de parámetros о; + · · -+ o, e p. 
Segue-se então pelo mesmo argumento usado na demonstração de (i) que 
X, t X, tem a distribuição binomial negativa especificada. 

A demonstração de (iii) é análoga as de (i) e (ii), e deixamo-la para o leitor 
a título de exercício. 


Suponha que o; =... = а = 1 no item (ii) do Teorema 1. Então cada 
uma das variáveis aleatórias X,, ..., X, distribui-se geometricamente com pa- 
rámetro p, е (ii) estabelece que X, +... + X, tem distribuição binomial negativa 


de parámetros r e p. Isto constitui uma demonstração alternativa do resultado 
obtido na бесао 3.5. 
O exemplo seguinte ilustra o uso de probabilidades condicionais. 

Exemplo 19. Sejam X,, X,,... variáveis aleatórias independentes, inteiras 
e não-negativas, tendo uma densidade comum. Suponha que So = 0 e 
Sn X, +... + X4, n > 1. Seja N uma variável aleatória inteira não-negativa 
e suponha que N, X,, X2, ... são independentes. Então Sy =X, +... + Xy 
é a soma de' um número aleatório de variáveis aleatórias. Para uma interpretação 
de Sy, suponha que no tempo O um número aleatório N de bactérias são intro- 
duzidos num sistema, e que no tempo 1 a colônia iniciada pela i-ésima bactéria 
contém X; membros. Então SN é o número total de bactérias presentes no tempo 1. 
Mostre que a função geratriz de probabilidade de Sy é dada por 


(31) Ф (0) = Фм(Фх, (1), —1<г<1. 


Para verificar (31) observamos inicialmente que 


P(Sy = x) = Y рб =х,М =) 
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- Y BN nS, -x[N-. 
=0 


Como N é independente de X,, X,,..., Xn, é independente de S,,.e portanto 
P(S, = x/N = n) = P(S, =x). Assim 


(32) P(Sy = х) = Y P(N = n)P(S, = х); 


Conseqüentemente para — 1 &£«&1]1 


oo 


Os (t) = Y EP(Sy = x) 


x=0 


= y te D PN = nYP(S =) 


= Y BN = n) Y PPS, = х) 


n=0 x=0 


Ш 
[Ms 
pas, 

z 

IL 


* n) Os (1) 


= У PWN = nd) = Ф(Фу(ї)). 


Exercícios 


1. Qualquer ponto no intervalo [0, 1) pode ser representado através de sua ex- 
pansão decimal 0, x,, x; ... Suponha que se escolhe, aleatoriamente, um 
ponto do intervalo [0, 1). Seja X о primeiro dígito da expansão decimal 
que representa o ponto. Determine a densidade de X. 

2. Suponha que X tenha uma densidade binomial negativa de parámetros a =r 
e p, (sendo r inteiro). Determine a densidade de X +r. 

3. Suponha que uma caixa contenha 6 bolas vermelhas e 4 pretas. Seleciona-se 
uma amostra aleatória de tamanho п. Seja X о nümero de bolas vermelhas 
na amostra. Determine a densidade de X para amostragem (a) sem reposição 
e (b) com reposição. | 

4. Seja N um nümero inteiro positivo e seja 


X1:2, NS 
para outros valores de x. 


19= c" 


, 


Determine o valor de c para o qual f é uma densidade de probabilidade. 


TI 


5. Suponha que X é uma variável aleatória tendo a densidade f dada por 


10. 
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Determine as seguintes probabilidades: 


(a) X é negativo; 

(b) X é par; 

(c) X assume um valor entre 1 e 8 (inclusivos); 
(d) P(X = —3/X < 0) 

(e) P(X 2 3/X » 0). 


. Suponha que X tem uma distribuição geométrica com p — 058. 


Determine as probabilidades dos seguintes eventos: 
(a) X23; 

(b) 4<Х<7 ou Х>9, 

(с) 3<X<5 ou 7<X<10. 


. Suponha que X se distribui uniformemente sobre 0, 1,..., 99. Determine: 


(a) Р(Х > 25); 

(b) P(2,5 € X € 12,2); 

(с) P(8« X«10 ou 30« X € 32); 
(d) P(25 « X « 30). 


. Suponha que uma caixa contém 12 bolas numeradas de 1 a 12. Faz-se duas 


repetições independentes do experimento de selecionar aleatoriamente uma 
bola da caixa. Seja X o maior entre os dois números observados. Determine 
a densidade de X. 


. Considere a situação do Exercício 8 em que a seleção é feita sem reposição. 


Determine a densidade de X. 


Seja X uma variável aleatória geometricamente distribuída com parâmetro р. 
Seja Y=X se X<M e Ү=М se X >M, istoé, Y=Min(X,M). Deter- 
mine a densidade de Y. 


. Suponha que X se distribui geometricamente com parámetro p. Determine 


a densidade de 


(а) X?; 
(b) X+3. 


. Suponha que uma caixa contém r bolas numeradas de 1 a r. Seleciona-se 


sem reposição uma amostra aleatória de tamanho n. Seja Y o maior número 
observado na amostra e Z o menor. 


(a) Determine a probabilidade P(Y < y). 
(b) Determine a probabilidade P(Z 2 z). 


— DÀ 


ES! 0 
0 


Determine as probabilidades dos seguintes eventos: 
(a) Y é par; 

(b) XY é ímpar; 

(0) 4>0 e Y 20: 


14. Seja X e Y duas variáveis aleatórias independentes com densidade uniforme 


em (0,1,...,N). Determine 
(а) Р(Х>Ү); 
(b) Р(Х = У). 


15. Sejam X е Y como no Exercício 14. Obtenha as densidades de: 


(a) min (X, Y); 
(b) max (X, Y); 
(с) |Y-Xl. 


16. Sejam X e Y duas variáveis aleatórias independentes tendo densidades geo- 


métricas de parámetros p, e р» respectivamente. 


Obtenha: 
(а) P(X2Y) 
(b) Р(Х= Y). 


17. Sejam X e Y como no Exercício 16. Obtenha a densidade de 


(a) min (X, Y); 
(БУДУ. 


18. Sejam X e Y variáveis aleatórias discretas e sejam g e h funções tais que 


satisfaçam a identidade. 
Р(Х =x, Y = y) = 906)h(0). 


(a) Expresse Р(Х =x) em termos de g e h. 
(b) Expresse P(Y =y) em termos de g e h. 
(c) Mostre que (2x g(x)) (Ly hQ)) = 1. 
(d) Mostre que X e Y são independentes. 
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19. 


20. 


21. 


22. 


24. 


25. 


Sejam X e Y variáveis aleatórias independentes com а mesma densidade 
geométrica de parámetro p. Sejam Z = Y — X e M= min (X, Y). 
(a) Mostre que рага 2 e m 2 0 inteiros 
Ңи=т,2=®9= (Axonom), 250, 
(b) Conclua de (a) que para z e m >Q inteiros 

P(M=m,Z=2)=p*1 - p" (1 — p)!*l. 
(c) Use (b) e o Exercício 18 para mostrar que M e Z são independentes. 


Suponha que um alvo circular está dividido em trés zonas limitadas pelos cír- 
culos concéntricos de raios 1/3, 1/2 e 1, conforme ilustra o diagrama seguinte. = 


9 


2 
3 


Figura 4 


Disparando-se aleatoriamente trés tiros ao alvo, qual a probabilidade de que 
exatamente um tiro atinja cada zona? 

Suponha que se distribui aleatoriamente 2r bolas em r caixas. Seja X; o 
número de bolas na caixa i. 


(a) Obtenha a densidade conjunta de X,,...,X,. 
(b) Obtenha a probabilidade de que cada caixa contenha exatamente 2 bolas. 


Considere um experimento com três resultados possíveis que ocorrem com 
probabilidades pı, p; е p3, respectivamente. Suponha que se realiza п 
repetições independentes do experimento e seja X; o número de vezes que 
ocorre o resultado i. 


(a) Qual é a densidade de X, + X;? 
(b) Determine Р(Х, =y |X; * X; =2), у = 0,1, 2,...,2. 


. Use a aproximação de Poisson para calcular a probabilidade de que no máximo 


2 dentre 50 motoristas tenham carteiras de habilitação inválida se normalmente 
5% dos motoristas o tem. 


Use a aproximação de Poisson para calcular a probabilidade de que uma caixa 
com 100 fusíveis contenha no máximo 2 fusíveis defeituosos se 3% dos fusíveis 
fabricados são defeituosos. 


Lança-se um dado até observar o número 6. 


(a) Qual é a probabilidade de que sejam necessários seis lançamentos no máximo? 


ES 


' 
27. 
28. 
29. 
' 


30. 


(b) Quantos lançamentos são necessários para que a probabilidade de obter 
6 seja no mínimo 1/2? 
Os Exercícios 26-30 são problemas inter-relacionados e baseiam-se em uma 


` sequência infinita de provas de Bernoulli conforme discussão da Seção 3.5. 
26. 


Seja T; o número de provas até (e inclusive) o iésimo sucesso. Sejam 
Ox, <---<x, números inteiros. Determine a probabilidade 


P(T, =x, T; = Kyss -sip = Xp). 
Sugestão: Faça W, = T, — Т,—у,г > 2 e W, = Т, ; então 


P(T, EE: Xis... Tp =X) 


=P(W, =X, №, =X a SET PR ERG ү). 


Use a seguir o fato de que as variáveis aleatórias W; — 1,..., №, — 1 são mu- 
tuamente independentes e têm a mesma distribuição geométrica de parâmetro p. 


Seja №, о número de sucessos nas primeiras n provas. Mostre que 
P(T, 2 x |N, = 1) L SERLO ES 
De uma forma mais geral, mostre que 
KT, x, Ta ООО T mr) ies 


Ос «x4 Sex SU. 


Isto mostra que, dado que ocorrem r sucessos nas primeiras n provas, as 
provas nas quais tais sucessos ocorrem constituem uma amostra aleatória de 
tamanho r (sem reposição) da “população” das localizações possíveis. 

Seja k um número inteiro positivo, k <r. Do Exercício 28 podemos deter- 
minar de imediato que 


Р(Т, = x| N, = r) = ( 2 ) Ми 


п 
(^) 
Realmente, se Тр = x, o k-ésimo sucesso ocorre na posição x. Nas primeiras 
x — 1 posições deve ocorrer exatamente k — 1 sucessos, e nas últimas n — x 
posições deve ocorrer exatamente r — k sucessos. Como, dado №, = r, as 
posições dos z sucessos constituem uma amostra aleatória de tamanho r da 
“população” de n posições, segue-se o resultado acima. Verifique que isto 
realmente acontece determinando P(Ty = x/N, = r) diretamente. 


Sejam 1 <i< j<r números inteiros não-negativos. Obtenha 
Р(Т; — x, Tj y | Ng =") 
para O€ x € y &n. 
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31. 


32. 


33. 


34. 
35. 


36. 


37. 


38. 
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Suponha que X e Y sejam variáveis aleatórias independentes que tenham densi- 
dade uniforme sobre 1,2,...,N. Determine a densidade de X + Y. 

Seja X uma variável aleatória uniformemente distribuída em ( 0, 1,2, ... N }. 
Obtenha y(r). 

Seja X uma variável aleatória inteira não-negativa cuja função geratriz de 
probabilidade é dada por Ф y(t) = e^ ^ —!), onde А > 0. Obtenha fy. 
Demonstre o item (iii) do Teorema 1. 

Sejam X e Y variáveis aleatórias independentes com densidades de Poisson 
de parâmetros A, e А,, respectivamente. Obtenha P(Y = y/X + Y = 2) 
para у = 0,...,2. Sugestão: use (iii) do Teorema 1. 

Sejam X, Y, e Z variáveis aleatórias independentes com densidades de Poisson 
de parámetros A;,A, e As, respectivamente. Obtenha 


P(X-x,Y-y,Z-z|XtY*tZ-xtytz) 


para números inteiros não-negativos x,y e z. Sugestão: use (iii) do Teorema 1. 
No Exemplo 19 suponha que X, assuma os valores 1 e O com probabilidades 
р е 1 —p, respectivamente, onde 0< p< 1. Suponha também que N tenha 
densidade de Poisson de parâmetro À. 


(a) Use a Equação (31) para obter a função geratriz de probabilidade de Sy. 
(b) Use (a) para obter a densidade de Sy. 


Para uma interpretação de Sy, suponha que se introduza um número aleatório 
N de células cancerosas no tempo O e que cada célula, independentemente 
das outras células e de N, tem probabilidade p de sobreviver a um tratamento 
radioativo. Seja X; = 1 sea i-ésima célula sobrevive e X; = 0 caso contrário. 
Então Sy é o número total de células que sobrevivem ao tratamento. 

Resolva (b) do Exercício 37 sem usar a função geratriz de probabilidade, mas 


usando em seu lugar a Equação (32) e o fato de que X, +... + X, tem uma 
densidade binomial. 


7, 


EXPECTANCIA DE VARIÁVEIS 
ALEATÓRIAS INDEPENDENTES 


Consideremos um certo jogo de azar. Para apostar no jogo devemos pagar 
uma importância de a dólares. Como resultado da aposta recebemos X dólares, 
onde X é uma variável aleatória cujos valores possíveis são х}, X2,- .., Xy. 
O problema é saber se devemos apostar no jogo. Se vamos apostar uma única vez, 
o problema é bastante difícil. Entretanto, suponha que apostamos um grande 
número de vezes. Após n apostas, pagaríamos na dólares e receberíamos 
X, +---+ X, dólares. Se supomos que as apostas sucessivas do jogo constituem 
repetições independentes do mesmo experimento (observação de um valor de X), 
podemos tomar as variáveis aleatórias X,, Х»,..., X, como sendo mutuamente 
independentes e tendo a densidade comum f de X. Seja Nn(x;) o número de 
apostas que resultam no valor x;, isto é, o número de X; que assumem o valor 
x;. Então podemos escrever 

r 
Ху ъ= 2 x;N (x). 


A quantia média recebida é então 


OR aue t Rm ў x [=e]. 
n ici n 

De acordo com a interpretação da probabilidade como freqüéncia relativa se n for 
grande, os números Nn(x;)/n devem ser aproximadamente iguais a f(x;), e assim 
a soma do segundo membro deve ser aproximadamente igual a u = ET — 1 xjf(xj). 
Assim parece razoável antecipar um ganho líquido no jogo se и > a e esperar uma 
perda líquida se и <a. Se и =a, anteciparíamos sair do jogo mais ou menos quites. 
A quantidade Zj—, x;f(x;) chama-se expectância da variável aleatória X. 

De uma forma mais geral, seja X uma variável aleatória discreta qualquer, que 


assume um número finito de valores x,, . . .,Xy. Então o valor esperado de X, 
representado рог EX ou p, é o número 
(1) EX = Y х/б), 


onde f é a densidade de X. 
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Suponha que X tem distribuição uniforme em x,,...,x, . Então fJ = 
= P(X=x;)=r"! ede(1) vemos que EX = (xı *---*x,)r^!, de modo que 
neste caso, EX é apenas a média aritmética dos valores possíveis бе Ж. Em æra 
(1) mostra que EX é a média aritmética dos valores possíveis de X; o peso asso- 
ciado ao i-ésimo valor x; é sua probabilidade f(x;). 

O valor esperado EX chama-se, também, média de X (ou da densidade f 
de X) e representa-se habitualmente por u. A média é uma forma de tentar reduzir 
a distribuição de probabilidade a um único número que se supõe representar o 
“valor típico” de X. O grau de adequação disto depende do grau de concentração 
dos valores de X em torno de u. Examinaremos este problema em maior detalhe 
quando discutirmos a variância de X na Seção 4.3. 

Exemplo 1. Distribuição binomial. Suponha qué X tem a distribuição binomial 
de parâmetros n e p. Obtenha EX. 

Para п = 1, X assume os valores O e 1 com probabilidades (1 — p) e p, 
respectivamente. Portanto: 


EX = 0: P(X = 0) + 1: P(X = 1) = р. 


Como uma variável aleatória, que tem densidade binomial de parámetros 
le p, é simplesmente uma variável aleatória indicadora, vemos que se pode obter 
a probabilidade de um evento 4, de que X = 1, determinando a expectância 
do seu indicador. 

Determinemos agora EX para n > 1 qualquer. Neste caso X assume os 
valores 0,1,2,...,n, e 


ЕХ = Уј H p — pri. 
j=0 WM 
Para calcular esta quantidade observamos que 


"m 


" n(n — 1)! 
G-0![n-0-6-1]! 


Assim 


ЕХ = п У E T 1 pl — py. 
jer Ad 1 
Fazendo a mudança de variável i =] — 1 vemos que 


em. п-1-1 
ЕХ =пр 2. ; JPG —p) À 


M 


4 


Pelo teorema binomial 


"v (n-1 i n-i- и 
ЕР, )ra- p» ЕУ =], 
de modo que 

EX = np. 


4.1. DEFINIÇÃO DE EXPECTÂNCIA 


Suponha agora que X é uma variável aleatória discreta qualquer, cujos valores 


possíveis são x1,X2,.... Gostaríamos de definir a expectância de X como 
(2) EX = р xf (xj. 
"Ex 
Se X tem apenas um número finito de valores possíveis x,,...,x,, então 


(2) é simplesmente a nossa definição anterior. No caso discreto geral, esta definição 
é válida desde que a soma У; x; f(x;) seja bem definida. Para que este seja o caso, 
exigimos que Z;|x;| f(x;) < =. Isto nos leva à seguinte definição. 
Definição 1. Seja X uma variável aleatória discreta com densidade f. 
Se Z; Ix;lf(x;) < oo, dizemos que X tem expectância finita e definimos 
sua expectância através de (2). Por outro lado, se E Ixil fŒ) = =, 
dizemos que X nào tem expectáncia finitae EX é indefinido. 


Se X é uma variável aleatória não-negativa, geralmente indica-se por EX « oo 
o fato de que ela tem expectáncia finita. 


Exemplo 2. Distribuição de Poisson. Suponha que X tem uma distribuição de 
Poisson de parámetros А. Então 


B. o Aj m 
ЕХ LL e^ c o MES А 
Ап ди“ 


T 
A 
q 

[] 
» 
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Exemplo 3. Distribuição geométrica. Suponha que X tem uma distribuição 
geométrica de parâmetro p. Obtenha EX. 
Do exemplo (2) temos 


EX = Y, јр - pf 
P 


ni - p it - pr^ 


-a1 -= p) 40-р. 
j=0 dp 
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Como se pode diferenciar uma série geométrica, termo por termo, segue-se que 
du ; 
ЕХ = -pl — p — У (1 — р). 
dp j-o 
Usando a fórmula da soma de uma progressão geométrica, vemos que, 
ny =] 
Еу == DES A pi = » (=). 
dp \р p 


Conseqüentemente 


Consideraremos a seguir um exemplo de uma densidade que nào tem média 
finita. 
Exemplo 4. Seja f a função definida em R por 
1 
f(x) = le + 1)” 


0, para outros valores de x 


X dq 


Obviamente a função f satisfaz as propriedades (i) e (ii) da definição de 
funções de densidade dada no Capítulo 3. Para ver se f satisfaz a propriedade 
(iii), observamos que 


e portanto 


© © 1 1 
2 fe Е 2 |: x + 1 
= (1 — 12) + 02 — 13) t ---— 1. 
Assim f satisfaz (iii) e portanto é uma densidade. Mas f não tem média 
finita porque 


o 


dde Tw 
L ife) = P x41 


x=1 


1 


e sabe-se muito bem que a série harmônica Zy =, х‘ não converge. 


4.2. PROPRIEDADES DA EXPECTÂNCIA 


Frequentemente desejamos determinar a expectância de uma variável aleatória 
como Z = X, +X, ou Z = X? que é em si mesma uma função y(X) do vetor 
aleatório X. Naturalmente isto pode ser feito usando (2) se conhecemos a densidade 
f; de Z. Entretanto, com bastante frequência a densidade de Z pode não ser 
conhecida ou, a determinação de EZ, a partir de uma dada densidade de Z, pode 
ser bastante difícil O resultado que apresentaremos a seguir nos dá uma forma 
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de decidir se Z tem expectância finita, e se tiver, de determinar EZ diretamente 
em termos da densidade fy e da função q. 


Antes de estabelecer este resultado, introduzimos uma convenção notacional. 
Seja X um vetor aleatório discreto r-dimensional que tem valores possíveis 


Xi, х),... e densidade f е seja y uma função real qualquer definida em К”. 
Então define-se Zy y(x) f(x) como 
(3) У Ф(х)/(х) = У e(x)f(x). 
х j 


Teorema 1 Seja X um vetor aleatório discretc tendo densidade f e seja 
y uma função real definida em R”. Então a variável aleatória Z = (X) 
tem expectância finita se e somente se 


(4) Юу lI) < oo 

e quando (4) é verdadeiro, 
(5) EZ = У owsa). 

Demonstração. Sejam 21, Z2, .. . os distintos valores possíveis de Z e 
sejam X;, Хә, . . . Os distintos valores possíveis de X. Para qualquer z; existe 


pelo menos um x; tal que, z; = ф(х;) mas, pode existir mais de um x; que 
satisfaz essa condição. Seja А, а coleção de tais x;, isto é, 


A; = (xil Ф(х) = 2). 


Então (Xe 4j) е {Z = z;) representam exatamente os mesmos eventos. 
Assim 


P(Z = z) = Р(ХєА, = i fx(x). 
Conseqüentemente, PU 


Ye) = YVAPZ = z) 
= Le Y A) 
-Y X iiA. 
Como (x) = 2; para x em Aj, dens Je ^ 
Ye) = Y Y oU). 


Por sua definição, os conjuntos 4; são disjuntos para valores distintos de 
j, e sua união é o conjunto de todos os valores possíveis de X. Portanto 


У 12172) = У lel. 


Isto mostra que Z tem expectáncia finita se, e somente se, (4) for verdadeiro. 
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Se 7 possui expectáncia finita, entáo repetindo o mesmo argumento acima 
sem os sinais de módulo, concluímos que (5) é verdadeiro. 

Seja X uma variável aleatória com densidade f е seja y(x) = | x |. Então 
pelo Teorema 1, | Х | tem expectância finita se, e somente se, Ух | x | f(x) < =. 
Mas, de acordo com nossa definição de expectância, X tem expectância se, e so- 
mente se, a mesma série converge. Vemos portanto que X tem expectância finita 
se, e somente se, E| X | <<, 

Usaremos agora o Teorema 1 para estabelecer as importantes propriedades 
da expectância que seguem. | 

Teorema 2. Sejam X e Y duas variáveis aleatórias tendo expectância finita. 

(i) Se c é uma constante e P(X = с) = 1, então EX = c. 

(ii) Se c é uma constante, então cX tem expectância finita e E(cX) = cEX. 

(ii) X + Y tem expectáncia finita e E(X + Y) = EX + EY. 

(iv) Suponha que Р(Х > Y) — 1. Então EX 2 EY; além do mais, EX — EY 

se, e somente se, Р(Х = Ү) = 1. 

(v) IEX| & E |X|. 

Demonstração. A demonstração de (i) é bastante simples. Se P(X — c) — 1, 
então X tem densidade fy (x) = 0 para x c e fx(c) = 1. Assim em virtude de (2) 


EX = У хД) educ) = é 


Para demonstrar (ii), seja y(x) = сх e observe que 
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У |сх|/х(х) = lel У Ixl) < о, 


де тойо que cX tem ехресійпсіа finita. Assim de (5) 
E(cX) = (Hf) = c Y, xfx(x) = СЕХ. 


Para estabelecer (iii) fazemos ф(х, у) = x ty eseja f a densidade conjunta 
de X e Y. Então 


Y x + у|/(х, у) € Y |х|/(х, у) + » | у|/(х, y) 
eye» 
= Y Ixl + Y yl» < o 


e portanto X + Y tem expectância finita. Aplicando (5) vemos que 
ЕХ + Y) 2 У (x + MfG. у) 
х,у А 


= L xf(x, у) + У yf, y) 


= EX + EY.. 


E 
| 


Para demonstrar (iv) observe qe /=Х-Ү=Х+ (— Y), e de acordo 
com (ii) e (iii) vemos que 


EX — EY = E(X — Y) = EZ = Y 2,02). 


Como P(Z20)-P(X2 Ү) = 1, os valores z; que 2 = X — Y assume, devem 
ser todos não-negativos. Assim У, zfz(z) > 0 e portanto EX — EY > 0. Isto 
conduz à primeira parte de (iv). Se EX = EY, então 


0 = EZ = Y 2/22). 


Mas a soma de termos náo negativos pode ser zero somente se todos os termos 
individuais forem zero. Como /fz(zj) > 0, devemos ter 2; = 0. Assim o único 
valor possível de Z é Ое consequentemente P(Z = 0) = 1: 

Finalmente (v) decorre de (iv) e (ii) porque — |X| & X &|.X| e portanto 
— E| X |< EX «E|X |. Isto completa a demonstração do teorema. 


Segue-se facilmente de (ii) e (ii) que se X,,..., X, são n variáveis 
aleatórias quaisquer que têm expectância finita e c;,...,cn são n constantes 
quaisquer, então 


(6) ReX rr REX) = ЕХ, + e + GEL. 


É útil saber que uma variável aleatória limitada sempre tem expectância finita. 
Mais precisamente 


Teorema 3. Seja X uma variável aleatória tal que Р(|Х|< М) = 1, рага 
uma alguma constante М. Então X tem expectância finita e |ЕХ|< М. 
Demonstração. Sejam x,,x;,... osvalorespossíveisde X. Então |x;| < М 
para todo і. Realmente, se | х; |> М para algum valor possível de x;, então 


P(X| > M) > Р(|Х| = |x) > 0, 
o que contradiz o fato de que P(| X | <M) = 1. Conseqüentemente 
Y 4\7) s M Y. f(x) < M, 
de modo que X tem expectáncia finita. dad do mais, em virtude de (v) do 
Teorema 2. 


IEX| < E|X| = У Ixl f(x) < M. 


Isto completa a demonstração. 
Segue-se facilmente do Teorema 3 e de (iii) do Teorema 2 que, se 
X e Y são duas variáveis aleatórias tais que, Y tem expectância finita e 
Р(| X — Y | < М) = 1, para alguma constante M, então X também tem expectáncia 
finita e | EX — EY |< M. Deixamos para o leitor a demonstração deste resultado. 
Uma vez que a expectância da soma de duas variáveis aleatórias é a soma de 
suas expectâncias, podia-se supor que a expectância de um produto fosse o produto 
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das expectâncias. Pode-se ver que isto não é verdade, em geral, considerando а 
variável aleatória X que assume cada um dos valores 1 e —1 com probabilidade 
1/2 e fazendo X = Y. Então ЕХ = ЕҮ = 0 mas EXY = EX? = 1. 

Existe um caso importante em que esta regra do produto é válida. Trata-se 
do caso em que X e Y são variáveis aleatórias independentes. Estabelecemos 
formalmente este caso a seguir. 


Teorema4. Sejam X e Y duas variáveis aleatórias independentes tendo 
expectâncias finitas. Então XY tem expectância finita e 


(7) E(XY) = (EX)(EY). 


Demonstração. Observe que a densidade conjunta de X e Y é fy (x)fy(»). 
uma vez que X e Y são independentes. Assim 


Y IxylfGs, у) = У lx ACHO) 


= (5 Але) (х ило) < c, 


de modo que XY tem expectáncia finita. Usando o Teorema 1 concluímos que 


E(XY) = У GAIA) 


= [zc] [E 2409] = Even, 
х » 

A recíproca desta propriedade não é verdadeira; duas variáveis aleatórias 
podem ser tais que E(XY) = (EXXEY) mesmo que X e Y não sejam inde- 
pendentes. 
Exemplo 5. Suponha que (X, Y) assume os valores (1,0), (0,1), (—1,0) e (0, —1) 
com probabilidades iguais. Então ЕХ = EY = 0. Como XY = О, segue-se que 
E(XY) = 0 e portanto E(XY) = (EX)(EY). Para ver que X e Y não são 
independentes, observe por exemplo que Р(Х = 0) = P(Y = 0) = 1/2 enquanto 
Р(Х = 0, Y = 0) = 0. Assim 


Р(Х = 0, У = 0) + Р(Х = 0)Р(У = 0). 


Freqüentemente é mais fácil determinar expectáncias usando as propriedades 
dadas no Teorema 2 do que usando diretamente a definição. Ilustraremos agora 
essa técnica com diversos exemplos. 


Exemplo 6. Distribuição binomial. Já sabemos do Exemplo 1 que a média da 
distribuição binomial de parámetros п e p é np. Podemos também obter este 
resultado de uma maneira muito simples, usando a propriedade de que a expectância 
de uma soma é a soma das expectâncias ((iii) do Teorema 2). Para isto, sejam 
X,,..., X4, n variáveis aleatórias independentes de Bernoulli de parâmetro р 


ER ————— E A pi — —— E 
к= 


e seja $„ = X, +...+ X,. Então S, tem a distribuição binomial de parámetros 
n e p. Da primeira parte do Exemplo 1 


ЕХ, = р,1 < і < п, eportanto 


п 
ES, = E(X, ++ X) = У ЕХ, = np. 
i=1 
Exemplo 7. Distribuição hipergeométrica. Suponha que temos uma população 
de r objetos dos quais r; são do tipo um e r — rı, são do tipo dois. Extrai-se 
desta população uma amostra sem reposição de tamanho n. Seja $, о número 
de objetos do tipo um na amostra. Determine ES ņ. 

Sabemos que S, tem distribuição hipergeométrica, de modo que poderíamos 
determinar ES, usando (2). Entretanto, é muito mais simples proceder intro- 
duzindo as variáveis aleatórias indicadoras X4, ..., X, da seguinte forma. A variável 
aleatória X; = 1 se, e somente se, o i-ésimo elemento da amostra é do tipo um. Então 


ES, = Y ЕХ, = п". 
i=1 r 
Mas S, = X, +... + X,, de modo que usando (iii) do Teorema 2 vemos que 


EX, = Р(Х; = 1) = 1. 
A 

Observe que as variáveis aleatórias X;, 1 &« in, não são independentes. 
Exemplo 8. Suponha que temos uma população de r objetos distintos numerados 
de 1 a r. Extrai-se os objetos com reposição até obter exatamente k <r objetos 
distintos. Seja 5; o tamanho da amostra necessária. Determine ES. 

É claro que S, = 1 e portanto ES, = 1. Suponha que k>2 e seja 
Xi = 5, — S; i = 1, 2,...,К– 1. Então claramente Sp = 1 * X, +...+ Хр. 
Mas X; é o nümero de objetos que se deve extrair até que o (i * 1)-ésimo objeto 
novo.entre na amostra, após o i-ésimo objeto novo ter entrado na amostra. Um 
pouco de raciocínio mostra que o evento (X; = п} ocorre se, e somente se, os 
primeiros п — 1 elementos, extraídos depois que o i-ésimo objeto novo entra 
na amostra, repetem um dos i objetos anteriores, e o n-ésimo elemento, extraído 
depois do i-ésimo objeto novo, é diferente dos i objetos anteriores. Assim, como 
as extrações são independentes, 


Ps PEC - `), ЖО ое 


Isto mostra que a variável aleatória X; — 1 distribui-se geometrica- 
mente com parâmetro p; = 1 — (i/r). Portanto, de acordo com o Exemplo 3, 
E(X; - D=pi;'(1-p;), е 


EX, = pi - p) + 1 = pi! = (1 — ilr) ! = r(r— i) *. 
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Conseqüentemente, 


(8) ES = 14 El А ) 


Ш 
mT 
I 
at^, 
E xS 
a 
Кре. 
~. 
м 


Е 1 1 ) 
r|[-4—— ++), 
py vm r—k-tl 

Registramos para uso futuro, que se torna claro da construção de X;, que 
elas são variáveis aleatórias mutuamente independentes. 

Vimos no capítulo anterior que variáveis aleatórias inteiras não-negativas 
X desempenham um papel proeminente. Para estas variáveis aleatórias pode-se 
frequentemente aplicar o teorema seguinte para decidir se X tem expectância 
finita e determinar a expectância de X. 


Teorema 5. Seja X uma variável aleatória inteira não-negativa. Então X 
tem expectância finita se, e somente se, a série Zy=, Р(Х 2 х) converge. 
Se à série converge, então 


(9) EX = Y Р(Х >x). 


Demonstracáo. Mostraremos que 


(10) У == E PU EG 


x-1 x 
do qual segue-se imediatamente o teorema. Para isso escrevemos inicialmente o 
primeiro membro de (10) como 


© х 
S PEE = У, 1. 
= = 
É possível inverter a ordem dos somatórios e reescrever esta expressão como 


Y Ў Р(Х = х) = Y Р(Х > у). 


У жеў у=1 
Substituindo a variável auxiliar y pela variável auxiliar x no segundo membro 
desta igualdade, obtemos o segundo membro de (10). Isto mostra que (10) é ver- 
dadeiro como desejado. 
Para uma aplicação elementar deste teorema, suponha que X é uma va- 
riável aleatória que se distribui geometricamente com parâmetro р. Então 
Р(Х 2 x) = (1 – р)х e de acordo com o teorema 


со 


EX = б = = + — p =-= р (1 — р). 


Isto está de acordo com o resultado obtido no Exemplo 3. 
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4.3. MOMENTOS 


Seja X uma variável aleatória discreta e seja r > 0 um nümero inteiro. 
Dizemos que X tem um momento de ordem r se X? tem expectáncia finita. 
Neste caso definimos o r-ésimo momento de X como ЕХ”. Se X tem um mo- 
mento de ordem r, então o r-ésimo momento de X — u, onde и é a média de X, 
chama-se r-ésimo momento central (ou r-ésimo momento em torno da média) 
de X. Podemos determinar pelo Teorema 1 o r-ésimo momento e o r-ésimo mo- 
mento central de X diretamente da densidade f pelas fórmulas 


(11) EX" = У x'f(x) 
е х 
(12) EX — uy = X — ШУО). 


x 


De acordo com (11) e (12), o r-ésimo momento e o r-ésimo momento central 
são determinados pela densidade f, de modo que faz sentido falar neles como 
о r-ésimo momento e o 7-ésimo momento central desta densidade. 

Suponha que X tem um momento de ordem r, entáo X tem um momento 
de ordem k para todo k &r. Para ver isto, observe que se |x| & 1, então 


p*| = Ix < 1 
enquanto para | x | 7 1, 
q = и. 
Assim, em ambos os casos é sempre verdade que 
Ixl* < ixl + 1. 
Então, pelo teorema da comparação para convergência de séries, vemos que 


Y ixi) < Y, xir + 11/69 = EX) + і < о, 


de modo que X* tem expectáncia finita. 

Por outro lado, como mostramos no Exemplo 4, uma variável aleatória X 
pode não ter nem mesmo o primeiro momento. Uma simples modificação deste 
exemplo mostra que uma variável aleatória pode ter um momento de ordem r 
mas não ter momentos de ordens superiores. (Ver Exercício 9.) 

O primeiro momento (r — 1) é simplesmente a média de X. Em geral, quanto 
maior o número de momentos de X que conhecemos, maior é a informação que 
temos sobre a distribuição de X; entretanto, os dois primeiros momentos são de 
maior interesse nas aplicações. 

Sabemos pela propriedade (iii) do Teorema 2 que se X е? У têm ambos um 
primeiro momento finito, então X + Y também o tem. Mostraremos a seguir 
que esta desejável propriedade mantém-se válida para momentos de ordem r. 
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Teorema 6. Se as variáveis aleatórias X e Y tém momentos de ordem r, 
entáo X + Y também tem momento de ordem r. 


Demonstração. Este teorema baseia-se na simples desigualdade a seguir. Para 
qualquer número inteiro não-negativo j &r, 


(13) [xD s np p xen 


Para ver isto, observe que se |х|<|у|, então |х|/1у|" 7 «ly |y] 77 = 
yl < 117 + ||”; enquanto se |x|>|y|, então |xl/Iy|" 77<|х|/ «< |х)" + |у. 
Assim (13) é verdadeiro. Usando (13) e o teorema binomial, vemos que 


х + 0" < (1х1 + 1) 


У, (berro 
| 


a > É (x + Ly. 
j=0 J 
Mas 
aE 
рУ () -2 
porque 
r r r r 
пзе, () e = Y p^ 
"HERD NI j=0 M 
Conseqüentemente 


Ix + у" < 2x + 12). 
Seja f а densidade conjunta de X e Y. Então 
Y x + fx) € 2 У (xl + 1797, y) 
х,у х,у 
ZE(X[ +Y 
2(E|X|" + Е|Ү|) < о. 


Portanto, pelo Teorema 1, (X + Y)” tem expectância finita. 

Segue-se facilmente por indução que se X,, Х,, ..., Xn tem todos um 
momento de ordem r, então X, +-.-+ X, também tem. 

Seja X uma variável aleatória que tem um momento finito de segunda ordem. 
Então a variância de X, representada por Var X ou V(X), é definida por 

Var X = E[(X — ЕХ)?]. 
Expandindo o segundo membro vemos que 
Var X = Е[Х? — (2Х)(ЕХ) + (ЕХ)?] 


= EX? — ЕХ)? + (EX). 


Em outras palavras 


(14) Var X = EX* = (EX). 
Representa-se frequentemente EX por и e Var X por o?. O número não- 
negativo о = y Var X chama-se desvio padrão de X ou de fy. 

De acordo com a nossa discussão anterior, и é o valor médio da variável alea- 
tória X. Um dos usos da variância é como uma medida da dispersão da distribuição 
de X em torno da média. Quanto maior a tendência de X de se afastar do seu 
valor médio, maior a tendência de (X — u)? de assumir valor grande, e portanto, 
maior será a variância. 

Por outro lado, Var X = O se,e somente se, X é uma constante. Para ver 
isto, observe que se Р(Х = с) = 1 para alguma constante с, então EX =c е 
Var X = 0. Reciprocamente, se Var X = 0, então P((X — EX)? = 0) = 1, portanto, 
E[(X — ЕХ)? | = 0. Conseqüentemente Р(Х = EX) = 1. 

О problema seguinte, que é de interesse em estatística, ilustra ит uso alter- 
nativo da média e variância. Seja X uma variável aleatória que tem um segundo 
momento finito, e suponha que desejamos determinar o valor de а que minimiza 
E(X — а)?. Tal valor nos daria uma constante que melhor se ajusta а X se o erro 
fosse medido pelo desvio quadrático médio. 


| Uma forma de resolver este problema é pelo uso de cálculo. Observe que 
ECC = a)" = EX DaBX Sa: 


Se diferenciarmos em relação a a e igualarmos a derivada a zero, veremos que 
a = EX. Como a segunda derivada é positiva (na realidade, ela é igual a 2), o ponto 
corresponde a um mínimo, e o valor mínimo é Var X. 

Existe uma segunda forma de resolver este problema que é também impor- 
tante compreender. Observe que 


(X - а)? = [(Х – p) + (u - а] 
= (X — uy + XX — uu — a) + (и — ay. 


Como E(X — и) = 0, o termo de produto cruzado tem expectância nula e portanto, 


| (15) EX — а)? = EX — uy + (и — ay 
| = Var X + (u – ay. 


| Torna-se claro que de (15) que E(X — a)? alcança um mínimo quando u=a, 
e que o valor deste mínimo é Var X. 

| Freqüentemente podemos determinar mais simplesmente os momentos de 

uma variável aleatória inteira nào negativa pela diferenciação de sua função geratriz 

de probabilidade Фу. Suponha por simplicidade que 


У A < © 


95 


рага algum ѓо > 1. Então podemos considerar Фу bem definido em — to <t € to 
através de 


x(t) = У ЛОР п mE d. 


Podemos diferenciar Py(t) qualquer número de vezes, diferenciando, termo a 
termo, a correspondente série de potências. Em particular 


oo 


ФИ) = Y хи)", = «t ts, 
x=1 


oo 


= Y xXx- DOE, e 


x=2 
Em virtude das hipóteses sobre to, podemos fazer t = 1 nestas fórmulas, obtendo 


o 


940) = Y х0) = EX 


Ф) = Y x& — DA) = EX(X — 1). 


х=2 
Assim, pode-se obter de Фу a média e a variância de X por meio das fórmulas 


EX = 641) 


Var X = EX? — (ЕХ)? = 041) + Ф,(1) — (Ф,(1))?. 

Pode-se desenvolver fórmulas semelhantes para os outros momentos de X em 
termos de derivadas superiores de by no ponto t=1. 

Ilustraremos a seguir o uso dessas fórmulas. 
Exemplo 9. Distribuição binomial negativa. Seja X uma variável aleatória com dis- 
tribuição binomial negativa de parámetros o e p. Obtenha a média e a variância de X. 

De acordo com o Exemplo 17 do Capítulo 3 sabemos que a função geratriz 
de X é dada рог Фү(ї)=р°[1—1(1—р) ] ©. Conseqüentemente 


ФИ) = epi — dt — Dj CMI — р) 


e 
Qt) = (а + Dap[1 — «1 — p] SA — py. 
Assim 
Ф) = а (2) 
SP 
e 


ФІ) = (x + Dx E T JE 
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Portanto, EX = ap! (1—p) e 


Var X 


Ш 
= 
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+ 
[жч 
— 
R 
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E 
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qe 
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+ 
R 
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Em particular, se X tem uma distribuição geométrica de parâmetro p, então 
EX - p^! (1 — p) (como já vimos) e Var X = p° (1 — p). 

Exemplo 10. Distribuição de Poisson. Suponha que X tem uma distribuição 
de Poisson de parámetro А. Obtenha a média e a variância de X. 


No Exemplo 18 do Capítulo 3 vimos que Фу (7) = e^ (4 - !), Assim 


Ф) = At- 


Dit) = 220-2), 


Conseqüentemente Фу(1) = А e Фұ(1) = А?. Segue-se imediatamente que 
EX = \, 
concorda com o resultado obtido no Exemplo 2,е 
УагХ = 42 +2 – 2? = 4. 


Isto mostra que se X tem uma distribuição de Poisson de parâmetro A, então 
a média e а variância de X são iguais a А. 


44. VARIÂNCIA DE UMA SOMA 


Sejam X e Y duas variáveis aleatórias que têm segundos momentos finitos. 
Então X + Y tem segundo momento finito e portanto variância finita. Temos que 


Var(X Уу = BI У) – EX + DP 

E[(X = EX) + (Y — EM] 

E(X = ЕХ)? + EO SET) 

AE = EO — EY] 

P Var X + Var Y + 2Е[(Х — ЕХ)(Ү — ЕҮ)]. 


Assim, ao contrário da média, a variância da soma de duas variáveis aleatórias 
não é em geral igual à soma das variâncias. 
A quantidade 


\ E[(X — ЕХ)(Ү — EY)] 


chama-se covariância de X e Y e representa-se por Cov (X, Y). 
Temos assim a importante fórmula 


(16) Var (X + Y) = Var X + Var Y + 2 Cov (X, Y). 
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Uma vez que 
(X — ЕХ)(Ү — EY) = XY — (Ү)(ЕХ) — X(EY) + (EXY(EY), 
tomando as expectáncias, vemos que 


(17) Cov(X, Y) = E[(X — EXXY — EY)] = E(XY) — (EXYEY). 


Desta forma, torna-se claro que Cov (X, Y) = O sempre que X e Y são indepen- 
dentes. (O Exemplo 5 mostra que a recíproca é falsa.) Vemos de (16) que se 
X e Y são variáveis aleatórias independentes, tendo segundos momentos finitos, 
então Var (X + Y) = Var X + Var Y. 

Em particular se P(Y = c) — 1 para alguma constante c, então X e Y 
são independentes e a variância de Y é zero; consequentemente 


(18) Var (X + с) = Var X + Var (c) = Var X. 


De uma forma mais geral, se X4, X2, .. . , Xn são n variáveis aleatórias, 
cada uma com segundo momento finito, entáo 


i=1 i=1 j=i+1 


n n п=— 1 п 
(19) Маг (X х) = УУХ +25 Y Сот. Xy 
| i i=1 
e em particular, se X,,..., X, são mutuamente independentes, então 
(20) Var (> х) E yo Мат X. 
\i=1 i=1 

Pode-se obter estas fórmulas através de um desenvolvimento direto parecido 
com (porém mais complicado que) o usado no caso n = 2, ou pode-se estabelecé-las 
por indução sobre n, partindo de n = 2. 


Em particular, se X,,...,X, são variáveis aleatórias independentes tendo 
variância comum o? (se elas têm a mesma densidade, por exemplo), então 


(21) Var (X, ++ X)=nVarX, = по?. 


Outro fato elementar, porém, bastante útil é que Var (aX) = а? Var X. 
Deixamos para o leitor a verificação deste fato. 
Exemplo 11. Distribuição binomial. Sejam, X,,..., X4, n variáveis aleatórias 
independentes de Bernoulli tendo cada uma a mesma probabilidade p de assumir 
o valor 1. Então (ver Exemplo 6) a soma 5, = X, +---+X, distribui-se bino- 
mialmente com parâmetros n e p. Mostramos anteriormente que ES, = np. 
Usando (21) obtemos de imediato que 


Var S, = n Var X,. 
Mas X} =X, porque X, éO ou 1. Assim ЕХ? = EX, =p e portanto 
Var X, = ЕХІ — (EX)? = p — р? = р(1 — р). 


Conseqüentemente Var Sn = np(1 — р). 
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Em resumo entáo, a média de шпа variável binomialmente distribuída é 
np e sua variância é пр(1 — р). 
Exemplo 12. Distribuição hipergeométrica. Considere a situação do Exemplo 7. 
Desejamos agora determinar Var S, para obter a variância de uma distribuição 
hipergeométrica. Para isso usaremos a equação (19). 
Para os indicadores independentes Х,,..., Х„, obtivemos anteriormente que 
a 


Р(Х; = 1) = ЕХ, = 4. 
r 


Como Х? = Xj vemos que 


Var X, = ЕХ? — (EX) = (2) M ar 


(0-8) 


A seguir determinamos as covariâncias. Suponha que 1 < і <ј <и. Como 
X;X; = 0 amenos que X; e X;. Sejam'ambos iguais a 1, temos que 


EXX,= Р(Х; = 1, Х, = 1) = (=) (521) 


А 
Assim 
Cov (X;, X;) = E(X;X ;) — (ЕХ (ЕХ) 
EG xe (y 
r(r — 1) r 
X (3) (2! В n) 
r r—i r 
s (3) Кеча 
r] rr- 1)” 
e portanto 
gre m —Dnp(nYr-r 
Cov (Xj X) = un ( j 1 
А i=1 = ( 3) 2 pr r(r e 1) 
Segue-se então de (19) que 
Var S = „Мет 25 п(п es 150. pu 
n 2 


{| Жоао. 


É interessante comparar a média e variâncias da distribuição hipergeométrica 
com as da distribuição binomial tendo a mesma probabilidade de sucesso p = (7; /?). 
Suponha que temos uma população de r objetos dos quais ғ, são do tipo um e 
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r —r, são do tipo dois. Extrai-se uma amostra de tamanho п da população. Seja 
Y onümero de objetos do tipo um na amostra. 

Se a amostragem é com reposição, Y distribui-se binomialmente com pará- 
metros п e p — (ri/r), e portanto 


ЕҮ =n (2) e Var Y = n (=) (1-5). 
r Gr in 

Por outro lado, se a amostragem é sem reposição, Y tem a distribuição hiper- 
geométrica, e 


mc) s "eese | 


A média é a mesma nos dois casos, mas a variância é menor na amostragem 
sem reposição. Intuitivamente, quanto maior a proximidade entre n e r, mais 
determinístico se torna Y, quando a amostragem é feita sem reposição. Realmente, 
se n =r, a variância é zero e P(Y = г) = 1. Mas se r é grande em comparação 
a n, de forma que (n/r) se aproxima de zero, a razão das variâncias obtidas nas 
amostragens com e sem reposição é próxima de um. Isto era de se esperar, pois, 
para n fixo e r grande, existe pouca diferença entre amostragem com reposição 
e amostragem sem reposição. 


4.5. COEFICIENTE DE CORRELAÇÃO 

Sejam X e .Y duas variáveis aleatórias tendo variâncias finitas e não-nulas. 
Uma medida do grau de dependência entre duas variáveis aleatórias é o coeficiente 
de correlação p(X, Y) definida por 


Cov (X. Y) 
У (Var X) (Var Y) 


(22) p = Д(Х, Y) = 


Diz-se que estas variáveis aleatórias não são correlacionadas se p = 0. Como 
Cov (X, Y)=0 se X e Y são independentes, vemos de imediato que variáveis 
aleatórias independentes não são correlacionadas. É também possível que variáveis 
aleatórias dependentes não sejam correlacionadas, como se pode ver do Exemplo 5. 

É importante para aplicações em estatística saber que o coeficiente de corre- q 
lação está sempre entre —1 е 1,e que |p |= 1 se, e somente se, Р(Х =aY)= 1 
para alguma constante a. Estes fatos são consequências imediatas da desigualdade 
básica a seguir chamada desigualdade de Schwarz. 


Teorema 7. A desigualdade de Schwarz. Suponha que X e Y têm segundos | 
momentos finitos. Então » 


Q3) [EXY)]* < (EX?)EY?). 


Além do mais a igualdade prevalece em (23) se e somente se. P(Y = 0) = 1 
ou P(X=aY)=1 para alguma constante a. 
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Demonstração. Se P(Y = 0) = 1, então P(XY = 0) = 1, ЕХҮ = 8 = 
EY? = 0; assim, neste caso (23) se verifica com a igualdade. Também = 
Р(Х = aY) = 1, um simples desenvolvimento mostrará que ambos os membros 
de (23) são iguais a (a? EY?)?. 

Mostraremos agora que (23) é sempre verdadeiro. Em virtude da discussão 
acima podemos supor que P(Y = 0) < 1 e portanto EY? > 0. A demonstração 
baseia-se em um artifício simples porém engenhoso. Observe que para qualquer 
número real À 


0 < E(X — АҮ) = REY? — 2АЕХҮ + EX? 


Trata-se de uma função quadrática de А. Como o coeficiente EY? de A? é posi- 
tivo, obtém-se o mínimo para algum valor de A, digamos А = a, que pode ser 
obtido pelo método usual de cálculo, ou seja, igualando a primeira derivada a zero 
e resolvendo а equação resultante. A resposta é а = [E(XY )]| EY?]!. Como o 
valor resultante da função é 


_ LEY] 
EY” 
segue-se que (23) é válido. Se a igualdade prevalecer na desigualdade de Schwarz, 
então vemos de (24) que E(X — aY}? = 0, de modo que 
P[(X — а) = 0] = 1. 


Isto completa a demonstração. 


(24) 0 < E(X — аў)” = EX? 


Aplicando a desigualdade de Schwarz às variáveis aleatórias (X — EX) e 

(Y — EY) vemos que 
(E[X — EX)(Y — END? < [EX — ELE — EY]: 
isto é, 
[Cov (X, Y)? < (Var X)(Var Y). 
Assim, pela definição de p 
IX, Y)| < 1. 

Vemos também pelo Teorema 7 que |p |= 1 se, e somente se, Р(Х =aY)=1 
para alguma constante a. 

O coeficiente de correlação é de uso limitado na teoria da probabilidade. 


Ele ocorre principalmente em estatística, e sua discussão mais detalhada será adiada 
para o Volume II. | 


4.6. DESIGUALDADE DE CHEBYSHEV 
Seja X uma variável aleatória não negativa tendo expectáncia finita e seja 
t um número real positivo. Defina a variável aleatória Y fazendo Y=0 se X «t 
е Y=t se Xt. Então Y é uma variável aleatória discreta tendo dois valores 
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possíveis O e f que ela assume com probabilidades P(Y =0)=P(X<t) е 
P(Y —t) = P(X >t) respectivamente. 
Assim 

PY =Y = rs OP = 0) =171Р(ҮУ = Т = PWM: 


Mas claramente X > Y e portanto EX > EY. Assim 


EX > EY = tP(X > t) 


" 


ou 


(25) BOX zer zi 
Pode-se deduzir de (25) uma considerável variedade de desigualdades üteis. 
А mais importante delas é a desigualdade de Chebyshev. 
Desigualdade de Chebyshev. Seja X uma variável aleatória com média 
и e variância finita 02. Então, para qualquer número real t > 0 
2 
c 


(26) Р(Х = up bs "E 


Para demonstrar (26), aplicamos (25) à variável aleatória não-negativa 
(Х – п)? e o número ї?. Concluímos que 
2 
Р(Х — |? > 1º) < 00 -5. 

Como (X — и)? > t? se, e somente se, | X — и |> t vemos que (26) é ver- 
dadeiro. 

A desigualdade de Chebyshev estabelece um limite superior em termos de 

Var X e t para a probabilidade de que X se desvie de sua média por mais ѓ uni- 

dades. Sua virtude reside em sua grande generalidade. Não se faz nenhuma restrição 

sobre a distribuição de X, exceto que ela possua variância finita. Esta desigualdade 

é o ponto de partida para vários desenvolvimentos teóricos. Para a maioria das 

distribuições que ocorrem na prática, existem limites muito mais rigorosos para 

P([X — и | > t) do que o dado pela desigualdade de Chebyshev, entretanto, exem- 

plos mostram que em geral o limite estabelecido pela desigualdade de Chebyshev 

não pode ser melhorado (ver Exercício 26). š H 

| 

t 


Sejam X,,..., X, n variáveis aleatórias independentes que têm a mesma 

distribuição, pode-se pensar nestas variáveis aleatórias como n medidas indepen- 
dentes de alguma grandeza, que se distribui, de acordo com sua distribuição comum. | 
Neste sentido falamos às vezes nas variáveis aleatórias X,,..., X, como, consti- | 
tuindo uma amostra aleatória de tamanho n desta distribuição. "i 
Suponha que a distribuição comum dessas variáveis aleatórias tenha média | 
finita и. Então, para п suficientemente grande, esperaríamos que sua média arit- | 
mética S,/n = (X, +- - -+ X4)/n se aproxime de u. Se X; tiver também va- | 
папсіа finita, então 
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зз 


Var (=) We 0 


n n n 


е assim, Var (S,/n) > 0 quando n > œ. Como foi discutido na Seção 4.3.. isto 
implica que, à medida que n cresce, a distribuição de !5,,п) se concentra mais 
em torno de sua média u. De modo mais preciso, aplicando a desigualdade de 
Chebyshev obtemos a desigualdade 


| 2 
(27) р ( 5, — ц > 5) < Var (5) Nj М 
п 8° nò? 
Em particular, segue-se de (27) que para qualquer 5 > 0 
(28) lim p (12: -p > ô) = 0. 
nc n 


Podemos interpretar (28) da seguinte forma. Pode-se pensar no nümero 
6 сото a precisão desejada na aproximação de и por S,/n. A Equação (28) 
garante-nos que, por menor que seja o valor escolhido para ô, a probabilidade 


de que S,/n aproxime и com esta precisão, isto é, Р(|($„/п) — u|« 6), con- 


verge para 1 à medida que o número de observações se torna grande. Este resultado 
chama-se Lei Fraca dos Grandes Nümeros. Nós demonstramos a lei fraca apenas 
sob a hipótese de que a variância de X; é finita. Na realidade isto não é necessário; 
tudo que é necessário é que X; tenha média finita. Enunciamos este resultado 
mais geral no teorema a seguir. A demonstração será dada no Capítulo 8. 


Teorema 8 Lei Fraca dos Grandes Números. Sejam X,, X;,..., X, vari- 
áveis aleatórias independentes tendo uma distribuição comum com média 
finita и eseja 5, =X, +... + X,. Então para qualquer ô > 0 

lim P( 2 – p >5)-0. 

nc n е. 


A lei fraca é válida sempre que X; tem média finita. Entretanto, se elas 


“têm também variância finita, então (27) se verifica. Esta é uma asserção mais precisa 


IS | 
uma vez que ela nos dá um limite superior para P fe -y| > ò) em termos de. n. 


Ilustraremos agora o uso de (27) aplicando-a a variáveis aleatórias com distribuição 
binomial. 

Suponha que Х,,.... X, sejam п variáveis aleatórias independentes de 
Bernoulli assumindo o valor 1 com probabilidade comum p. Então и =p e 
о? = p(1— р). Assim, (27) mostra que 
o 

BA 
Como р(1—р) < 1/4 se 0 <р «1 (porque métodos habituais de cálculo mostram 
que р(1 — p) alcança o seu máximo para р = 1/2), segue-se que, independen- 
temente do valor de p, 


Uy JI EP >) = 


in 
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o» P(E- a=) а | 
A Equação (29) é útil quando conhecemos o valor de p, enquanto (30) nos dá | 
um limite para P ( > = | = J , que é válida para qualquer valor de p. Se p es- | 
tiver próximo de 1/2, (29) e (30) nào diferem muito, mas se p estiver longe de ; 
1/2, a estimativa dada por (29) pode ser muito melhor. (Na realidade, mesmo Y 


os limites dados por (29) são bastante pobres. No Capítulo 7 discutiremos outro 
método que produz estimativas muito melhores). 

Suponha que ô e є > 0 são dados. Podemos usar (29) ou (30) para obter 
um limite inferior para o número necessário de provas para nos garantir que 


(5 


РЕ 
Realmente, de (29) vemos que este será о caso se p(1 — p)/nô? < є. Resolvendo | 


> 2) SUB. 
n 
para п vemos que n > р(1 — p)/eô?. Se usarmos (30), n > (4e5? )-! provas 


serão suficientes. Observamos novamente que estes limites dados pela desigualdade 
de Chebyshev são pobres e que na realidade um número muito menor de provas 
pode ser suficiente. 

Como uma ilustração da diferença entre estas duas estimativas, escolha б = 0,1 
e e=0,01. Então 6? є = 10"? e de (30) vemos que para garantir que 


p (|> - p >01) < 001 
n 


necessitaríamos de п = 10*/4 = 2500 observações. Suponha, entretanto, que 
soubéssemos que р = 0,1. Então, como р(1 — р) = 0,09, vemos de (29) que 
| n > 0,09 x 10º = 900 observações serão suficientes. Para р = 1/2, (29) produz 
a mesma estimativa de (30), ou seja 2500. 
Para ilustrar a pobreza dos limites de Chebyshev no caso da distribuição bi- | 
nomial, suponha que 7 = 100 e p = 1/2. | 
De (29) obtemos então. 
Se E 


dr 


Este resultado deve ser comparado com o valor exato desta probabilidade que é 0,038. 


>01 | < 0,25. 


Exercícios 


1. Seja N um número inteiro positivo e seja f a função definida por 
2x 
Дх) = INN -10' 


0, outros valores de x 


ЕО. М, 


тез, 


bei. л ола» эт 


Mostre que f é uma densidade discreta e obtenha sua média. Sugestão: 
N N N(N + 2N + 
NUR. z + ão .. DON - D 


x=1 2 х=1 6 


. Suponha que X tem uma densidade binomial de parâmetros n = 4 e p. 


Obtenha E sen (7.X/2). 


. Suponha que X tem uma densidade de Poisson de parâmetro А. Determine 


a média de (1+ X)^!. 


4. Se X tem média le Y tem média 3, qual é a média de 2X + 5Y? 


. Suponha que X e Y são duas variáveis aleatórias tais que 


Р(\Х-Ү|< М) = 1 


para alguma constante M. Mostre que зе Y tem expectância finita, então 


' X tem expectância finitae |EX — EY | < M. 
. Seja X uma variável aleatória com distribuição geométrica e seja M > 0 um 


número positivo. Faça Z = min (X, M). Determine a média de Z. Sugestão: 


' use o Teorema 5. 
. Seja X uma variável aleatória com distribuição geométrica e seja M > 0 um 


número positivo. Faça Y = Max (X, M). Determine a média de Y. Sugestão: 
determine P(Y < y) e a seguir use o Teorema 5. 


. Suponha que X se distribui uniformemente sobre ( 0,1,...,N). Determine 


a média e variância de X usando a sugestão do Exercício 1. 


. Construa um exemplo de uma densidade que tem um momento finito de ordem 


r, mas não tem nenhum momento de ordem superior a r. Sugestão: considere 
i d o t 
asérie Уу-у x-(*?) е transforme-a em uma densidade. 


. Suponha que X e Y são duas variáveis aleatórias independentes tais que 


EX* = 2, EY? = 1, EX? = 1, e EY = 0. Determine Var (X? Y). 


. Mostre que Var (aX) — a? Var X. 
. Suponha que X se distribui binomialmente com parámetros п e p. Use a 


função geratriz de probabilidade de X para determinar sua média e variância. 


. Seja X uma variável aleatória inteira não-negativa. 


(a) Mostre que 


Ot) = Et”, =т=т 
Du = EXE O —-]«t«l, 
e 
qr = ЕХО -IF = «of. 


(b) Use o Teorema 4 para demonstrar que se X e Y são variáveis aleatórias 
inteiras, não-negativas e independentes, então 
Фу+у(@) = D(1)Dy(t), des d, 
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14. 


15. 


16. 


20. 


2i. 


Sejam X e Y duas variáveis aleatórias independentes tendo segundos momentos 
finitos. Determine a média e a variância de 2X +3 Y em termos das de X e Y. 
Sejam X,,..., Xn variáveis aleatórias independentes tendo uma densidade 
comum com média u е variância 02. Faça X =(Х, +...+ X,)/n. 


(a) Escrevendo X, — X = (Xy — и) – (X — и), mostre que 
È u- Ху = У О, – 0? – п – н. 
(b) Conclua de (a) que 
E (X (X, — xy) = (n — 1)о?. 
Suponha que se distribua aleatoriamente п bolas em r caixas. Seja X; — 1, 


se а caixa i estiver vazia e, seja X; = 0 caso contrário. 


(a) Determine EX;. 

(b) Para i £j determine E(X;X;). 

(c) Seja S, o número de caixas vazias. Escreva S, = X, + -- -+ X,, e use 
o resultado de (a) para determinar ES,. 

(d) Use os resultados de (а) e (b) para determinar Var S,. 


. Suponha que tenhamos dois baralhos de cartas, cada um com as cartas nume- 


radas de 1 a п. Utilizando estas cartas forma-se n pares, cada par contendo uma 
carta de cada baralho. Dizemos que ocorre um encontro na posição i se o 
par i é constituído de cartas de mesmo valor. Seja S, o número de encontros. 
(a) Determine ES,. 
(b) Determine Var Sp. 
Sugestão: seja X; = 1 se ocorre um encontro na posição i, e seja X; — 0 
caso contrário. Então 5, = X; + -- -+ Xn. Dos resultados do Capítulo 2 
sabemos que Р(Х; = 1) = 1/п e quese i  j, 
Р(Х; = 1, Х; = 1) = аы 
n(n — 1) 


. Considere a variável aleatória Sy introduzida no Exemplo 8. Determine Var Sp. 
19. 


Estabeleça as seguintes propriedades da covariância: 
(a) Cov(X, Y) =Cov(Y,X); 


(b) Cov (X aX, Y һу) = Ў Ў ab; Cov (X, Y). 


і= = { і 


Sejam X,, Х е X; variáveis aleatórias independentes tendo variáncias finitas 
e positivas 02, 02 е 03, respectivamente. Obtenha a correlação entre 
X-X eX+X. 

Suponha que: X e Y são duas variáveis aleatórias tais que p(X, Y) = 1/2, 
Var X = 1 e Var Y — 2. Obtenha Var(X — 2Y). 


22. Uma caixa contém 3 bolas vermelhas e 2 pretas. Extrai-se uma amostra 
sem reposição de tamanho dois. Sejam U e Ё os números de bolas vermelhas 
e pretas, respectivamente, na amostra. Determine p(U, V). 

23. Suponha que uma caixa contém 3 bolas numeradas de 1 a 3. Seleciona-se 
sem reposição duas bolas da caixa. Seja X o número da primeira bola e Y 
o número da segunda bola. 
Determine Cov (X, Y) e p(X, Y). 

24. Suponha que se repete п vezes um experimento tendo r resultados possíveis 


1,2,...,r que ocorrem com probabilidades p,,...,p,. Seja X o número 
de vezes que ocorre o resultado 1 e seja Y o número de vezes que ocorre 
o resultado 2. 
Mostré que p(X. Y) = A Pı P2 

(ср – р) 


através das seguintes etapas. Faça /; = 1 se ocorre resultado 1 na i-ésima 
repetição, e I; = 0, caso contrário. Similarmente faga J; = 1 se ocorre 
resultado 2 na i-ésima repetição, J; = 0 para outros valores. Então 
X-—I,t.-tl, e Y-J, *---*t /„. A seguir mostre que 


(a) E(IjJj) = 0. 
(b) Se £j, E(IiJj) = р\р». 


(с) EXY) = E (È Idi) + E (X X A 
= n(n — 1)р\р;. 
(d) Cov(X, Y) = -npip;. 


Quen Hm 
(4 — pnt — po) 

25. Suponha que uma população de r objetos é constituída de r, objetos de 
tipo 1, r; objetos do tipo 2e гз objetos do tipo 3, onde rı + t r4 =r. 
Toma-se desta população uma amostra aleatória sem reposição de tamanho 
n <r. Seja X o número de objetos do tipo 1 e Y o número de objetos do 
tipo 2 na amostra. Determine р(Х, Y) da seguinte forma: Faça 1; = 1 ou O 
dependendo de se o i-ésimo objeto é do tipo 1 ou não,e J; = 1 ou O depen- 
dendo de se o i-ésimo objeto é do tipo 2 ou não. 


(a) Mostre que El;=r,/re EJ;=ra/r. 
(b) Mostre que para i  j, 


| 
| 
| 
| 
| 
| 
| 


игы: 2з. 
oer T) 


е que E(IjJi) = 0. 
(с) Faça X 21, +... tI, e Ү=Л,+.--+./„ euse a e b, para determi- 
nar E(XY), Var X e Var Y. 
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27. 


28. 


29. 


30. 


(d) Use (c) para determinar p(X, Y). Compare com o correspondente coe- 
ficiente de correlação do Exercício 24 p, —ri/r e p; —r;/r. 


26. Seja X uma variável aleatória tendo a densidade f dada por 


ES аа 8, 
70) 9 elm xii. 


Mostre que existe um valor de ô tal que P(| X — u|2 6) = Var X/8?, de 

modo que em geral o limite dado pela desigualdade de Chebyshev nào pode 

ser melhorado. 

Um fabricante de parafusos sabe que 5% de sua produção é defeituosa. Ele 

oferece uma garantia sobre sua remessa de 10.000 itens, prometendo reembolsar 

o dinheiro se mais de a parafusos forem defeituosos. Qual o menor valor que 

o fabricante pode atribuir a a e ainda continuar seguro de que não precisa 

reembolsar o dinheiro em mais de 1% de vezes? 

Suponha que X tem densidade de Poisson de parâmetro А. Use a desigualdade 

de Chebyshev para verificar as seguintes desigualdades: 

(а) Р(х «?) 24, Ommi, 
2 À А 

Seja X uma variável aleatória inteira não-negativa cuja função geratriz de 

probabilidade Dy(t) = EtX é finita para todo ѓ eseja xo um número inteiro 

positivo. Argumentando como na demonstração da desigualdade de Chebyshev, 

verifique as seguintes desigualdades: 


(а) PX < хо) < 20, о<т<1; 
i 
P(t) 

(Б) Р(Х > х) < ры é tl. 


Suponha que X tem densidade de Poisson de parâmetro A. Verifique as 
seguintes desigualdades: 


Yr 


(a) P (x < j < (2) (Ы к> 24) < (9). 


Sugestão: use cálculo para minimizar os segundos membros das desigualdades 
do Exercício 29. Estas desigualdades são "muito mais rigorosas do que as dadas 
no Exercício 28. 

Os Exercícios 31 e 36 desenvolvem e aplicam as noções de densidade condicional. 
Sejam X e Y duas variáveis aleatórias discretas. Define-se a densidade condi- 
cional fy|x(y|x) de Y dado X=x através de 


_ [РУ = у|Х = х), её Р(Х =х)> 0; 
Trayi a= \0, para outros valores de x. 


91. 


32. 


33. 


34. 


35. 


36. 


Segue-se que fy;x(Y 1х) é uma densidade em y para qualquer х - шше 
Р(Х = х) > 0. O Exemplo 14(d) do Capítulo 3 pode ser interpretado diz== == 
que se X e Y são independentes e se distribuem geometricamente com рагё- 


— 


metro p, então, para z > 0, a densidade condicional de Y dado X + Y 
é a densidade uniforme em (0,1,...,z). 

Suponha que Y tem expectáncia finita. Define-se como expectáncia condi- 
cional de Y dado x =x a média da densidade condicional de Y dado X = х, 
isto é, 


E[Y| X — х] = У, yfrixlo | х). 


Verifique as seguintes propriedades de densidade condicional e da expectância 
condicional: 


(а) HO) = LHC) |); (b) EY = DS AGELY | X = x]. 


Sejam X e Y duas variáveis aleatórias independentes com densidade geo- 
métrica de parámetro p. Determine E[Y|X + Y=z] onde 2 é um inteiro 
não-negativo. Sugestão: Use o Exemplo 14(d) e o Exercício 8. 

Sejam X e Y duas variáveis aleatórias independentes com distribuições de 
Poisson de parámetros А, e A», respectivamente. Determine E[Y | X * Y —z] 
onde z é um inteiro não-negativo. Sugestão: use o resultado do Exercício 35 
do Capítulo 3. | 

Seja.N uma variável aleatória inteira náo-negativa. Sejam (Y,), n 2 O, vari- 
áveis aleatórias com expectáncias finitas e independentes de N. Mostre que 

E[Y, | N = n] = EY, 

Sejam (X,), n > 1, variáveis aleatórias independentes tendo média и eva- 
riância o? finitas e comuns. Faça Sọ = 0 e Sn = X, *---* X4,n2 1. Seja 
М uma variável aleatória inteira não-negativa com média e variância finitas, e 


suponha que N é independente de todas variáveis aleatórias definidas em 
termos de (X4), п > 1. Então 5, tem média e variância finitas. Mostre que 


ES, = uEN, ES? = &?EN + WEN?, 
Var Sy = o?EN + y? Var М. 
Sugestão: use os Exercícios 31(b) e 34. 


Obtenha os resultados do Exercício 35 diferenciando a função geratriz de 
probabilidade de Sy obtida no Exemplo 19 do Capítulo 3 e fazendo t = 1. 
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VARIÁVEIS ALEATÓRIAS CONTÍNUAS 


No Capítulo 3 consideramos as variáveis aleatórias discretas e suas densidades 
como, por exemplo, a binomial, a hipergeométrica e a de Poisson. Nas aplicações, 
estas variáveis aleatórias representam tipicamente o número de objetos de um certo 
tipo, como o número de bolas vermelhas em uma amostra aleatória de tamanho 7, 
com ou sem reposição, ou o número de chamadas que chegam a uma central tele- 
fônica num minuto. 

Existem muitas situações, tanto teóricas como aplicadas, em que as variáveis 
aleatórias naturais a considerar são “contínuas” em vez de discretas. Como apro- 
ximação inicial, podemos definir uma variável aleatória contínua X num espaço 
de probabilidade 9 como uma função X(w), w E Q, tal que 


P({w | Х(о)=х})= 0, —о < x < ә, 


isto 6, tal дие Х assume qualquer valor específico х com probabilidade zero. 

É fácil pensar em exemplos de variáveis aleatórias contínuas. Como primeira 
ilustração, considere um modelo probabilístico para os tempos de desintegração 
de um número finito de partículas radioativas. Seja Т o tempo que decorre até 
a desintegração da primeira partícula. Então, T seria uma variável aleatória contínua, 
pois a probabilidade de que a primeira desintegração ocorra num tempo específico 
(por exemplo, Т = 2.0000... segundos) é zero. Como segundo exemplo, consi- 
dere o experimento de escolher ao acaso um ponto de um subconjunto 5 do espaço 
euclidiano n-dimensional, tendo um volume n-dimensional finito não-nulo (lembre-se 
da discussão deste experimento no Capítulo 1). Seja X a variável aleatória que 
representa a primeira coordenada do ponto escolhido. Suponha, por exemplo, 
que п = 2 e que 5 seja um disco de raio unitário no plano, centrado na origem. 
Então, o conjunto de pontos em 5 que tem a primeira coordenada zero é um seg- 
mento de reta no plano. Qualquer segmento como este tem área zero e portanto 
probabilidade zero. 

De uma forma geral, as variáveis aleatórias que representam medidas de gran- 
dezas físicas como coordenadas espaciais, peso, tempo, temperatura e voltagem 


são descritas mais adequadamente como variáveis aleatórias contínuas. Variáveis 
aleatórias associadas às contagens de objetos ou eventos são exemplos típicos de 
variáveis aleatórias discretas. 

Entretanto, existem casos em que tanto a formulação discreta como a contínua 
poderiam ser apropriadas. Assim, embora normalmente a medida de comprimento 
seja considerada como uma variável aleatória contínua, poderíamos considerar a 
medida arredondada para um certo número de casas decimais, e portanto como 
sendo uma variável aleatória discreta. 


5.1. VARIÁVEIS ALEATÓRIAS E SUAS FUNÇÕES DE DISTRIBUIÇÃO 


Nas aplicações, uma variável aleatória representa uma quantidade numérica 
definida em termos do resultado de um experimento aleatório. Matematicamente, 
entretanto, uma variável aleatória X é uma função real definida num espaço de 
probabilidade. Naturalmente desejamos que P(X < x) seja bem definida para todo 
número real x. Em outras palavras, se (Q, «7, P) for um espaço de probabilidade 
sobre o qual se define X, desejamos que 


{wl X(w)<x) 


seja um evento (isto é, um elemento de 27). Isto nos leva às definições abaixo. 


Definição 1. Uma variável aleatória X num espaço de probabilidade (Q, 4, P) 
é uma função real X(w), w € Q, tal que { о | X(w) <x} é um evento 
para —ee « x < ә, 

Definição 2. A função de distribuição F de uma variável aleatória X é а função 


F(xX))-P(X&x) | —e«x«e, 


A função de distribuição é útil na determinação de diferentes probabilidades 
associadas com a variável aleatória X. Um exemplo disto é a fórmula 


(1) P(a<X<b)=F(b)-F(a), a<b. 


Para verificar a validade de (1), faça-se A = {ш | X(w)<ajeB=(w|X(w)<b). 
Então А СВ e, segundo a definição de variável aleatória, А e B são ambos eventos. 
Portanto (wla<X<bj=BNAº é um evento e (1) é um caso especial do 
fato demonstrado na Seção 1.3, de acordo com o qual, se А © В, então 


P(BNAS)=P(B)-P(A). 


Exemplo 1. Considere o experimento de escolher ao acaso um ponto do disco 
de raio R no plano, centrado na origem. Para tornar o experimento mais inte- 
ressante, podemos imaginá-lo como sendo o resultado do lançamento de um dardo 
sobre um alvo circular. Associado a este experimento, está o espaço uniforme de 


2 


probabilidade descrito na Seção 1.2. Seja X a variável aleatória que representa а 
distância do ponto escolhido à origem. É fácil determinar a função de distribuição 
de X. Se 0 < x < R, oevento (w|X(w) < x) éo disco de raio x no plano, 
centrado na origem. Sua área é пх?. Assim, pela definição de um espaço uniforme 
de probabilidade, 


їх? x 

Р(Х<ху= à = Rm О<х «А. 

Se, x < 0, então Р(Х €x) = 0. Se x >К, então P(X €x) = 1. Assim, a função 
de distribuição F da variável aleatória X é dada por 


0, x<0, 
(2) F= | к^, DSR, 
ПЁ XR. 


O gráfico de F é dado na Figura 1. Segue-se das fórmulas (1) e (2) que 
se 0O<a<Sb<SR, então 


pira? 


P(a < X <b) = F(b) — F(a) = R? 


Figura 1 


Exemplo 2. Considere um modelo probabilístico para os tempos de desintegração 
de um número finito de partículas radioativas. Seja X o tempo de desintegração 
de uma partícula específica. Obtenha a função de distribuição de X. 


Como vimos na Seção 1.1, para um valor positivo adequado de À, 
P(a<Xx<b)=e-M –-е-№, Q<a<b<o, 


Já que X assume somente valores positivos, Р(Х < х) = 0 para x < 0 e, em 
particular, Р(Х < 0) = 0. Рага 0 x € es, 
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Р(Х <х) = Р(Х <0) + Р(0< X&x)— 
=Р(0<Х<х)= 
= | e AX. 


Assim, X tem a função de distribuição F dada por 


0, х<0, 
(9) Fre L-e w x10: 

Naturalmente as variáveis aleatórias discretas também tem funções de dis- 
tribuição, duas das quais foram determinadas nos Exemplos 10 e 11 do Capítulo 3. 
Exemplo 3. Suponha que X tenha uma distribuição binomial de parâmetros 
n=2 e p=1/2. Então f(0) = 1/4, f(1)= 1/2 e f(2) = 1/4. Conseqüentemente 


0, х<0, 
1/4, 0<х<1, 

Е(х) = | 3/4, 1<х<2, 
1 PASO A 


O gráfico desta função de distribuição é dado na Figura 2. 


(0) 1 2 


Figura 2 


5.1.1. PROPRIEDADES DE FUNÇÕES DE DISTRIBUIÇÃO. Nem todas as funções 
ocorrem como funções de distribuição, pois as últimas devem satisfazer certas con- 
dições. Seja X uma variável aleatória e seja F sua função de distribuição. Então 

(0) O<F(x)< 1 para todo x. 

(ii) F é uma função não decrescente de x. 

A propriedade (i) decorre imediatamente da propriedade de definição 
F(x) = P(X < x). Para verificar a validade de (ii), precisamos simplesmente observar 
que se x <y, então 


F(y) — F(x) = P(x € X & y) 7 0. 


boa 


ét 


Diz-se que uma função f tem um limite L à direita (à esquerda) no ponto 
x se f(x + h) ^ L para h — 0 através de valores positivos (negativos). Quando 
existem, representam-se os limites à direita e à esquerda por f(x +) e f(x —. Não 
é difícil mostrar que se f for limitada e náo-crescente ou não-decrescente, então 
f(x +) e f(x —) existem para todo x. Sob as mesmas condições, f tem os limites 
f(—9») para x > —e» e f(+o) para x > +. 

Das propriedades (i) e (ii) e da discussáo do parágrafo precedente, segue-se 
que a função de distribuição F tem os limites F(x +) e F(x —) para todo x, 
bem сото os limites F(—9») e F(+%). 

(ii) Е(—)=0 e F(*e) = 1. 

(iv) F(x*) = F(x) para todo x. 

Para avaliar F(—œ) e F(+>) precisamos apenas obter os limites de F(n) 
para п > —°° e п > +æ, (Isto decorre do fato de que F é não-decrescente). 
Seja 


B, = [w|X(w)<n]. 


Enion CB, EB, EB EB ER E, Também 
— o0 +o 
П В, = 2 е U В, = 0. 
п= 0 п= 0 


Segue-se então os resultados do Teorema 1 do Capítulo 1 que 
lim P(B, = MD) = 0 e шп BB) = PO) = 1. 


n-*-— 00 пә to 


De vez que F(n) = P(X <n) = Р(В,), vemos que 


F(—o) = lim F(n)= lim P(B) = 0 


m> =— со 


e analogamente que (+оо) = 1. 
A propriedade (iv) estabelece que F é uma função contínua à direita e que 


(4) Р(х+у=Р(Х=х)„ es xo, 
Um resultado intimamente relacionado com (4) é 
(5) F(x—-)-2P(X€x) -v<x<o, 


As demonstrações de (4) e (5) são semelhantes à de (iii). Para demonstrar (4), 
por exemplo, precisamos apenas mostrar que F(x + 1 In)>P(X<x) para n > tee. 
Isto pode ser feito definindo 


B,-luiX(ejext Li, 
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observando que (), B, = (o | X(w) € x) e repetindo o argumento de (iii). 
Vemos imediatamente de (4) e (5) que 


(6) F(x*) — F(x—) = P(X = x), eo < x < оо, 

Esta fórmula estabelece que se P(X = x) > 0, então F apresenta um salto de 
magnitude P(X = x) no ponto x. Se P(X = х) = 0, então F é contínua no 
ponto x. Lembramos o conceito de uma variável aleatória contínua (introdução 
deste capítulo). 

Definição 3. Chama-se uma variável aleatória X de variável aleatória 

contínua se 

P(X=x)=0, -—e«x«e, 

Vemos agora que X é uma variável aleatória contínua se, e somente se, sua 
função de distribuição F for contínua para cada x, isto é, F for uma função 
contínua. Se X for uma variável aleatória contínua, então além de (1) temos que 
(7) P(a « X <Б) 2 Pla&X&b)- P(a & X « b) 

= F(b) — F(a), 
de modo que < e < podem ser usados indiscriminadamente neste contexto. 
As diversas propriedades de uma função de distribuição estão ilustradas na Figura 3. 
(Observe que a variável aleatória com esta função de distribuição não seria nem 
discreta nem contínua.) 


Е (+) 1 


F (x+)—F (х—)=Р (X =x) 


| 


F(x-) 


y=0 
Figura 3 


Considere a variável aleatória X definida no Exemplo 1. Da fórmula (2) 
ou Figura 1 vemos que sua distribuição é contínua. Então X é uma variável alea- 
tória contínua. Da mesma forma torna-se claro de (3) que a variável aleatória do 
Exemplo 2 é uma variável aleatória contínua. 
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A maioria das variáveis aleatórias que ocorrem nas aplicações práticas são 
discretas ou contínuas. Existem algumas exceções. Considere o Exemplo 2. Neste 
exemplo, X representa o tempo até a desintegração de uma partícula específica. 
Se o experimento durar apenas um tempo especificado, digamos até o tempo 
to > 0, e a partícula não se desintegrar até este instante, o seu tempo real até a 
desintegração não será observado. Uma possível forma de contornar esta dificuldade 

т é definir uma nova variável aleatória Y da seguinte forma 
X(w) е  X(o)&te, 
Ү(ш) = 
to se — X(o) > tg. 


"a Assim Y é o tempo de degradação, se este tempo for observado (isto é, for menor 
ou igual а to) e Y = tọ caso contrário. A função de distribuição Fy de Y é 


dada por 
0, pot 
Еү(у) = 11—e-", O<y<to, 
ile Yy È to. 


A função de distribuição apresenta um salto de magnitude e— Ato no ponto y = to. 
Assim fica claro que a variável aleatória Y que acabamos de construir não é discreta 
nem contínua. 

Nós definimos funções de distribuição em termos de variáveis aleatórias. 
Elas podem ser definidas diretamente. 


Definição 4. Uma função de distribuição é qualquer função F que satisfaz 
as propriedades (i)-(iv); isto é, 

() О<А(х) <1 paratodo x, 

(ii) F.é uma função não decrescente de x, 

(ii) F(—99) 20 e F(+%)=1, 

(iv) F(x*) = F(x) para todo x. 

Em textos mais avançados demonstra-se que se F for ums função de distri- 
buição, necessariamente existe um espaço de probabilidade e ums varzzvel aleatória 
X definida neste espaço tal дие F é a função de distribuição de X 


B 
5.2. DENSIDADES DE VARIÁVEIS ALEATÓRIAS CONTINUAS 
Na prática define-se geralmente as funções de dsmibação em termos de 
› funções de densidade. 


Definição 5. Uma função de densidade (== s=acão а 39272530) é uma função 
não-negativa f tal que 
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Observe que se f for uma função de densidade, então a função F definida por 
(8) вә) = | m -ю<х<о, 


é uma função contínua que satisfaz as propriedades (i)-(iv) da Seção 5.1.1. Assim 
(8) define uma função de distribuição contínua. Dizemos que esta função de dis- 
tribuição tem densidade f. É possível, embora difícil, construir exemplos de funções 
de distribuição contínuas que não possuem densidades. Aquelas que realmente pos- 
suem densidades são chamadas de funções de distribuição absolutamente contínuas. 

Se X for uma variável aleatória contínua tendo F como sua função de 
distribuição, onde F é dada por (8), então f é também chamada de densidade 
de X. Usatemos o termo “função de densidade” em relação a funções de densidade 
discreta ou a funções de densidade em relação à integração. Deverá ficar claro, 
no contexto, o tipo de função de densidade que está sendo considerado. Por 
exemplo, a frase “seja X uma variável aleatória contínua de densidade f” implica 
necessariamente que f é uma função de densidade em relação à integração. 

Segue-se de (1) e (8) que se X for uma variável aleatória contínua de den- 
sidade f, cntão 


(9) Pla < Хе bS EE dx, azb, 


* 


ou de uma forma um pouco mais geral, que 


^ 


(10) Р(Х є А) = | f(x) dx 


se A for a união de um número finito ou infinito coritável de intervalos disjuntos. 
Assim P(X € A) pode ser representada como a área sob a curva f com x abran- 
gendo o conjunto A (ver Figura 4). 


Na maioria das aplicações, a maneira mais fácil de determinar as densidades 
de variáveis aleatórias contínuas é diferenciar (8) e obter 


(11) f(x) = ЕЁ (х), —e«x«e, 
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Estritamente falando. (11) é válida em todos os pontos x onde f é contínua. 
Exemplo 4 Seja X a variável aleatória do Exemplo 1 tendo a função de densidade 
F dada por (2). Então 


0, х= 0, 
(12) (х) = Ка ох <Р, 
0, х > В. 


А função F não é diferenciável no ponto x = К. Entretanto, se definirmos f 
por f(x) = Е (х), x К, e f(R) = 0, este f será uma densidade рага F. 

Observamos que (8) nào define f de maneira ünica, uma vez que podemos 
alterar o valor de uma função em um número finito de pontos sem alterar a integral 
da função sobre intervalos. Uma forma típica de definir f é fazer f(x) = Ғ (х) 
sempre que F'(x) existe e f(x) = 0 caso contrário. Isto define uma densidade 
de F desde que F seja sempre contínuae que F’ exista e seja contínua em todos, 
exceto num nümero finito de pontos. 

Existem outras maneiras de derivar ou verificar fórmulas para a densidade 
de uma função de distribuição contínua F. Dada uma função de densidade f, 
podemos mostrar que f é uma função de densidade de F verificando que (8) 
é válida. Alternativamente, podemos inverter este processo e mostrar que F pode 
ser escrita na forma (8) para alguma função não-negativa f. Então f é necessa- 
riamente uma densidade de F. Estes métodos, essencialmente equivalentes entre si, 
são geralmente mais complicados que o da diferenciação. Entretanto são mais 
rigorosos e evitam a necessidade de consideração especial dos pontos em que Fx) 
não existe. 

Ilustraremos o uso destes métodos no primeiro exemplo da subseção seguinte. 


5.2.1. FÓRMULAS PARA MUDANÇAS DE VARIÁVEL. Seja X uma variável 
aleatória contínua de densidade f. Discutimos métodos de obter a densidade de 
uma variável aleatória Y que seja função de X. 


Exemplo 5. Seja X uma variável aleatória contínua de densidade f. Obtenha a 
densidade da variável aleatória Y = X?. 


Para resolver este problema, inicialmente representamos por F e G as funções 
de distribuição de X е Y, respectivamente. Então G(y) = 0 para y <0. 
Para y>0 


С(у) = Р(У & уу=Р(Х? <y) 
=Р(- Ny & X « yy) 
= Е(уу) - F(- уу) 


e por diferenciação vemos que 
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С) = x (ЕМУ) + FC- 9) 
E a а 
= уу; UND + C9» 


Assim Y = X? {ет а densidade g dada por 


—. (fy)*f(C-NV») paa у>, 
2 y 


0 para y «0. 


(13) 90) = 


Embora (13) seja válido em geral, nossa derivação depende de diferenciação que 
pode não ser válida para todos os pontos. Para dar uma demonstração elementar 
porém rigorosa de (13), podemos definir g através do segundo membro de (13) 
e escrever para x > 0 


x Ae - 
[ior = [aeo + 1-9) do. 
— oo 0 2 y 
Fazendo a mudança de variável 2 = yy (de modo que dz = dy/2 Vy), obtemos 


x Ух 
[ооф = [| (ә) + n7» 


[so dz 


F(Vx) — F(='*) = G(x), 


|І 


de modo que g é geralmente uma densidade de С. 

Daqui para frente usaremos livremente a diferenciação para estabelecer fór- 
mulas como (13), sabendo que se necessário poderíamos apresentar derivações 
alternativas via integração. 

Consideremos agora o uso de (13) para obter a densidade de X?, onde X 
é a variável aleatória definida no Exemplo 1. Determinamos no Exemplo 4 a densi- 
dade de X como sendo f(x) = 2x/R? para 0O<x<R e f(x) = 0 para outros 
valores de x. Assim, usando (13) vemos que X? tem a densidade g dada por 


ue 1 
go) a NE E 
IVIR UR 


Ocy«R?, 


е g(y) = 0 para outros valores de y. Esta densidade é uma densidade uniforme 
em (0, R?) de acordo com a seguinte. 


тэрт» cm 
—-— 


F vnam 
IIIA 


Amr 


uL m 


moa 


Definição 6. Sejam а e b duas constantes com а <Б. A densidade uniforme 
no intervalo (а,Ь) é a densidade f definida por 


—ay! «b 
(14) kac x а) para а<х<Ь, 


para outros valores de x. 


A função de distribuição correspondente a (14) é dada por 


0, xa, 
(15) Е(х) = i(x-a)l(b-a), a<x<b, 
I x >b. 


Não é difícil encontrar outros exemplos de variáveis aleatórias uniformemente 
distribuídas. Quando se gira um dial bem equilibrado, é razoável supor que o ângulo 
do ponteiro (convenientemente definido em radianos) ao parar, após um grande 
número de revoluções, se distribua uniformemente em (—7,7) ou equivalentemente 
em (0,27). Nas aplicações da teoria da probabilidade em cálculo numérico, supõe-se 
frequentemente que o erro de arredondamento cometido pelo abandono de todos 
os dígitos além de n casas decimais se distribui uniformemente em (0, 10-7). 
Exemplo 6. Suponha que X se distribui uniformemente em (0,1). Obtenha 
a densidade de Y = —A^! log(1— X) para А> 0. 

Seja G a função de distribuição de Y. Observamos inicialmente que Y 


é uma variável aleatória positiva e consequentemente G(y) = O para y < 0. Para 
у> 0 temos | 


С(у)=Р(Ү < y) = P(— X^! 1ор(1—Х)< y) 
= P(log (1 — X) > — Xy) 
-P(1-X2e-M) 
-P(X&1-—e-M) 
= 1 е-лу, 


Portanto С (у) = Ae-^/ para у> 0 е G'(y) = 0 para у < 0. Portanto a den- 
sidade de Y é dada por 


Ы Хе уф). 
о) 90)= |0 у&0. 


Esta densidade chama-se densidade exponencial de parámetro № е será discutida 
mais detalhadamente na seção seguinte. 


O exemplo acima é um caso especial de problemas que podem ser resolvidos 
por meio do teorema seguinte. 
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Teorema 1. Seja y uma função diferenciéwe! estritamente crescente ou 
estritamente decrescente em um intervalo J. e sjam (Г) o contradomínio 
de p e v^! a função inversa de у. Seja X uma variável aleatória contínua 
de densidade f tal que f(x) = 0 pars x € I. Então Y = o(X) tem den- 
sidade g dada por g(y) = 0 para у# dl) 


a d. 4 N 6684 
(17) 90) = е! 0») | g,"* OM» теи. 
É um pouco mais sugestivo escrever (17) em sua forma equivalente 


(18) 90) = О) 


а |, УЄ (ЇЇ) e х=! (у) 


(ou alternativamente g(y)ldy| = f(x)ldxl). 

Para derivar (17), sejam F e G as funções de distribuição de X e Y res- 
pectivamente. Suponha inicialmente que ø seja estritamente crescente (isto é, 
фё(хү) < ш(х„) se x, <x,,x, EI e x, ЄП. Então q” é estritamente crescente 


em (Г) e para y € e(1), 
G(y) - P(Y <y) 
— P(e(X) < y) 
=Р(Х < г! (у)) 
= F(v'! (у)). 


Assim, pela regra de diferenciação em cadeia 


= 7. F(e (9) 
ae S NEC 
= PF Oia v Q) 


= (480) "5 eto. 
Mas 


i e0-[£2«0| 


porque c^! é estritamente crescente, de modo que (17) é válida. Suponha a seguir 
que у seja estritamente decrescente em 1. Então q^! é estritamente decrescente 
em (I), e para y Є (І). 
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G(y) =Р(Ү & y) 


- P(o(X) < y) 
=Р(Х > 9) 
-1-F(e!(). 
À Assim 
Су) = Е (e^! (9) 5 e") 
| = feo» (- $00). 
| Mas 


колны C 
Ts (y) oo (y), 


porque q^! é estritamente decrescente. Portanto vemos que G tem a densidade g 
dada por (17) em qualquer um dos casos. 


Exemplo 7. Seja X uma variável aleatória tendo uma densidade exponencial 
de parámetro А. Obtenha a densidade de Y = X! /8, onde Bo. 

De acordo com a definição do exemplo anterior, a densidade de X é dada 
por f(x) =he- M para x>0 e f(x) = 0 para x < 0. O teorema acima é aplicável 
com у(х) = x!/0, x > 0. А equação y = x!/? tem a solução х = y? que nos dá 
dx/dy = Вуё - !. Assim, de acordo com (18), Y tem a densidade g dada por 


ОЕ Араа, 


90у) = yso. 


Exemplo 8. Seja X uma variável aleatória contínua com densidade f e sejam 
а e b duas constantes, com b = 0. Então, de acordo com o Teorema 1, a densidade 
da variável aleatória Y =a +bX é dada por 


j — a 

i (19) so- 7 (E) -=<у<=. 

| Como uma ilustração desta fórmula, seja X a variável aleatória definida no Exemplo 1. 
| No Exemplo 4 determinamos sua densidade f como sendo f(x) = 2x/R? para 
« O«x«R e f(x) = 0 para outros valores de x. Considere a variável aleatória 
t Y = Х/К eseja g sua densidade. Então, pela Fórmula (19) com a — 0 e b= 1/R, 


бО) = Куу 2y,  0«y«l. 


е g(y) = 0 рага outros valores de у. 
123 


Se o leitor preferir, pode derivar fórmulas como as dos Exemplos 7 e 8 usando 
o método direto do Exemplo 6 em vez do Teorema 1. 


Como vimos nos exemplos acima, podemos construir funções de densidade 
considerando funções de variáveis aleatórias. Existe outra maneira simples de cons- 
truir funções de densidade. Seja g uma função não-negativa qualquer, tal que 


0< Í g(x) dx < oo. 


Então sempre se pode normalizar g para obter uma função de densidade f = c^! g, 
onde c éa constante 


= ЕЗ д(х) ах. 


Os exemplos seguintes ilustram este método. 
Exemplo 9. Seja g(x) = x(1 — x) se O€x < e g(x)=0 para outros valores 
de x. Então 


1 x^ x? 1 1 
e= f xa оа = (5 ЕЕ 


ef=c! д é dada por f(x) = 6х (1 —x) se U<x<1 e f(x) = 0 para outros - 


valores de x. A função de distribuição correspondente é dada рог F(x) = 0 para 
x«0,F(x) 23x? – 2х% para 0<х<1 e F(x)=1 para х> 1. 

Exemplo 10. Seja g(x) = 1/(1 + x?), -v<x<o, Sabemos de cálculo que 
a integral indefinida de 1/(1 + х2) é arctg x. Assim 


Ё dx ка л | z) 
c= -= aelig x = - – | --| = п. 
=ф l b. — co 2 


Conseqüentemente / = c^! g é dada por 


1 
dx pi за. 


Esta densidade é conhecida como a densidade de Cauchy. А HOS de distribuição 
correspondente é dada por 


Ро) =-у + — arcig x, — r4 


Como ilustração de uma variável aleatória com distribuição de Cauchy, temos 
o seguinte: 

Exemplo 11. Seja X a tangente de um ângulo (medido em radianos) escolhido 
ao acaso de (— 7/2, 1/2). Determine a distribuição de X. 
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Na resolução deste problema designaremos por Ө a variável aleatória que 
representa o ángulo escolhido, medido em radianos. Então X = tg Ө e portanto 
(ver Figura 5) para —% < x < ee. 


Р(Х < x) = P( tg Ө < x) 


Е; 


Figura 5 


5.2.2. DENSIDADES SIMÉTRICAS. Encerraremos esta seção discutindo den- 
sidades simétricas e variáveis aleatórias simétricas. Diz-se que uma função de den- 
sidade f é simétrica se f(x) = f(—x) para todo x. A densidade de Cauchy e а 
densidade uniforme em (—a, a) são ambas simétricas. Diz-se que uma variável 
aleatória X é simétricase X e —X têm a mesma função de distribuição. O resul- 
tado do seguinte mostra que estes dois conceitos são intimamente relacionados. 


Teorema 2. Seja X uma variável aleatória que possui uma densidade, 

então X tem uma densidade simétrica se, e somente se, X for uma variável 

aleatória simétrica. 

Demonstração. Demonstraremos este resultado para variáveis aleatórias 
contínuas. A demonstração é similar para variáveis aleatórias discretas. Na nossa 
demonstração usaremos fato de que para qualquer função integrável f 


nx 


AK-»4- | 04. -o <x < o. 


Suponha inicialmente que X tenha uma densidade simétrica f. Então 
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P(-X < x) = Р(Х > -x) 


EOL 


С 


Px 


f(—y) dy 


` 


nx 


f(y) dy 


J- 


Р(Х < x), 


de modo que X e —X têm a mesma função de distribuição. 

Suponha ao contrário que X e —X tenham uma densidade comum g. 
Defina f através de f(x) = (g(x) + g(—x))/2. Então f é claramente uma função 
de densidade simétrica. Além disso 


fx 


g(y) dy + 1/2 Г g(— у) dy 


~ 


[ “Ia 


1/2 


. 


Il 
jo 
t3 


a) dy +10 | a dy 


M ==: “ 


1/2[Р(Х < x)] + 1/2[Р(—Х > —х)] 


Ш 


Р(Х < x). 


Assim X possui a densidade simétrica / como desejado. 

Se uma função de distribuição contínua F tem uma densidade simétrica f, 
então F(0) = 1/2. Os valores de F para x negativos podem ser calculados a 
partir dos valores de F para x positivos, pois 


Fx) = [7700 
= [ADA 
E O dy 


- [| ow- [roo 


e portanto 


(20) Е(— x)= 1— F(x), —oo« x < co, 


Por esta razão, quando se constrói tabelas de uma função de distribuição simétrica, 
geralmente só se apresenta valores não-negativos de x. 


ic iniciei ` 


5.3. DENSIDADES NORMAL, EXPONENCIAL E GAMA 


Discutiremos nesta seção três das mais importantes famílias de funções de 
densidade na teoria da probabilidade e estatística. 


5.3.1 DENSIDADE NORMAL. Seja g(x) = e*'/2, —= < x < œ, Para 
normalizar g e transformá-la em uma densidade, precisamos avaliar a constante 


> 2 
с = | е” Т И. 
"^E 


Não existe nenhuma fórmula simples para a integral indefinida de e- *^/2. А ma- 
neira mais fácil de avaliar c é através de um artifício especial em que escrevemos 
с como uma integral bidimensional e introduzimos as coordenadas polares. Para 


ser específico 
© А о " 
VI | е? ax | ev dy 
чи oo 


z z 
© © 

E, | f e C *»)9i2 ах dy 
= 00 = о 
o n 


Í (| 7^, do) dr 
0 -g 


st 2 
2n | re"? dr 


0 


© 
—r2/2 


— 2ле 


io 
= 2л. 


Assim c —4/27 е a forma normalizada de g é dada por 
f(x) = Q1)-1/2e-x*/2, | -ee c x « ce, 

Deixamos também registrada a fórmula 

(21) А e?! dx = n. 


A densidade que acabamos de derivar chama-se densidade normal padráo 
e representa-se geralmente por y, de modo que 


| (22) КО) E come mp 
J2n 
A densidade normal padrão é claramente simétrica. Representa-se a função de 
distribuição de y por Ф. Não existe nenhuma fórmula simples рага Ф de modo 
que ela deve ser avaliada numericamente. Existem rotinas de computador e tabelas 
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como а Tabela I no final deste livro para determinar Ф. Uma vez que Ф é simétrica, 
(20) é aplicável e 


(23) $(-x)-1-6(x,  —e«x«e. 
Seja X шта variável aleatória com densidade normal padrão y e seja 


Y =ц + оХ, onde o> 0. Então pela Fórmula (19) Y tem a densidade g dada 
por 


g(y) = 75 г? т-с a pm o 
o л 


Esta densidade chama-se densidade normal de média и е variância o°, sendo 
representada por n(u, о?) ou n(y;u,o?), —v<y<o, Portanto 


(24) ту; шо?) = == ga» — 1 e pm — о <у< о. 


oV 27 c т 


Como não definimos ainda momentos de variáveis aleatórias contínuas, podemos 
pensar temporariamente em u e o? como os parâmetros da família de densidades 
normais. A função de distribuição correspondente pode ser calculada em termos 
de &, pois 


REX 


| 
29 
E 
+ 
q 
Da 
IA 
Rs 


I 
"v 
5 
PN 
A 
е 
| 
ES 
RI 


' Segue-se que se Y tiver a distribuição n(u, 0?) e a & b, então 


(25) Рр(а<Ү<Ь)=% (+=) -e (==). 


Suponha por exemplo, que Y tenha a densidade n(1,4) e sejam a = 0 e b=3. 
Da Tabela I obtemos que 


P(0< Y <3) = Ф(1) — Ф(— 1/2) = Ф(1) - (1— Ф(1/2)) 
= 0,8413 — 0,3085 
= 0,5328. 


Se uma variável aleatória Y se distribui segundo n(u,o?), então a variável 
aleatória a + bY, b 0, se distribui segundo n(a + bu, b? o?). Isto é uma apli- 
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cação direta de (19). Alternativamente podemos escrever Y = u + oX com X 
tendo distribuição normal padrão. Então 


a+bY=a+b(utoX)=(a+bu)+boX, 


que se distribui segundo n(a + bu, b? o°). 

“Variáveis aleatórias normalmente distribuídas ocorrem com bastante freqüéncia 
em aplicações práticas. A Lei de Maxwell em física estabelece que, sob condições 
apropriadas, os componentes da velocidade de uma molécula de gás se distribuirão 
segundo uma densidade normal n(0, o?) em que o? depende de certas quantidades 
físicas. Na maioria das aplicações entretanto, as variáveis aleatórias de interesse 
têm função de distribuição que é apenas aproximadamente normal. Por exemplo, 
constatou-se empiricamente que os erros de medida em experimentos físicos, a 
variabilidade da eficiência das linhas de produção e a variabilidade biológica (como 
a do peso e a da altura) têm distribuição aproximadamente normais. Constatou-se 
também, tanto empírica como teoricamente, que flutuações aleatórias resultantes 
da combinação de um grande número de causas não relacionadas, insignificantes 
individualmente, tendem a se distribuirem de forma aproximadamente normal. 
Os resultados teóricos neste sentido são conhecidos como “teoremas do limite 
central” e desenvolveram-se em um dos mais importantes tópicos de pesquisa em 
teoria da probabilidade. Um destes teoremas será discutido no Capítulo 7 e demons- 
trado no Capítulo 8. A importância das distribuições normais decorre também de 
suas atraentes propriedades teóricas. Um exemplo é a propriedade segundo a qual 
a soma de variáveis aleatórias independentes normalmente distribuídas também se 
distribui normalmente. Este fato será demonstrado no Capítulo 6. No volume II 
veremos que distribuições normais também desempenham um papel fundamental 
em estatística teórica e aplicada. 


5.3.2. DENSIDADES EXPONENCIAIS. A densidade exponencial de parâmetro 
À foi definida na Seção 5.2. Ela é dada por 


№- AX x>0, 


(26) уо) = | o ep 


A função de distribuição correspondente é 


(27) Ft) = po ri x>0, 


x«9O. 


Da discussáo do Capítulo 1 e Exemplo 2 deste capítulo vemos que variáveis 
aleatórias, exponencialmente distribuídas, são úteis para o estudo de tempos até 
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a desintegração de partículas radioativas. Também são úteis para desenvolver mo- 
delos envolvendo muitos outros tempos de espera, tais como o tempo até a falha 
de um equipamento, o tempo necessário para completar uma tarefa ou o tempo 
que decorre até a chegada de um novo usuário. As variáveis aleatórias, exponenci- 
almente distribuídas, têm também importância teórica, como se pode ver estudando 
os processos de Poisson (Capítulo 9) ou as cadeias de Markov no tempo contínuo 
(Volume III). 

Uma importante propriedade de variáveis aleatórias exponencialmente dis- 
tribuídas é que se X for uma tal variável, então 


(28) P(X>a+b)=P(X>a)PX>b),  a20 e b>0. 


(Esta fórmula é similar àquela obtida no Capítulo 3 para variáveis aleatórias geome- 
tricamente distribuídas.) Para ver que (28) é válida, seja А o parâmetro da dis- 
tribuição exponencial de X. Então, de (27) temos 

Р(Х =OP > Db) = етет 


= е Mash) 


Р(Х » a 4 b). 
Uma forma equivalente porém mais sugestiva de (28) é 
(29) P(XDa+b|X>Da)=P(X>b), a20 e b20. 


Pense em X como o tempo que decorre até a falha de um equipamento após sua 
instalação. Então (29) afirma que, sob a condição de que o equipamento não falhe 
até o tempo 4, a probabilidade de falhar além de não ocorrer nas próximas b uni- 
dades de tempo, é igual à probabilidade incondicional do equipamento não falhar 
nas primeiras b unidades de tempo. Isto implica que o envelhecimento do equi- 
pamento não aumenta nem diminui sua probabilidade de falhar num dado intervalo 
de tempo. 

O teorema seguinte mostra que (28) ou (29) caracteriza a família das dis- 
tribuições exponenciais. 

Teorema 3. Seja X uma variável aleatória tal que (28) se verifica. Então 

ou Р(Х > 0) = 0 ou X tem distribuição exponencial. 


Demonstração. Se Р(Х > 0) = 0, então (28) se verifica trivialmente. Su- 
ponha que (28) se verifique e que Р(Х > 0) = 0. Então vemos de (28) com 
a=b=0 que Р(Х > 0) = 1, de modo que X é uma variável aleatória positiva. 
Seja F a função de distribuição de X e defina G através de G(x) = 1 — F(x) = 
=P(X>x). Então G é uma função não crescente, contínua à direita, G(0) = 1, 
С(+оо) = 0, e de acordo com (28) 


G(a+b)=G(a)G(b), a>0 e b>0. 


үл 


Segue-se que se с> 0 e т e n forem inteiros positivos, então 
(30) G(nc) = (С(с))" e С(с) = (С(с/т))". 


Afirmamos a seguir que 0 < G(1) < 1. Pois se G(1) = 1, então G(n) = 
(G(1)) = 1, o que contradiz G(*o») = 0. Se G(1) = 0, então G(1/m) = 0 
e pela continuidade à direita, G(0) = O, outra contradição. 

Uma vez que 0< G(1)< 1, podemos escrever G(1) = e-^ onde 0A < =, 
Segue-se de (30) se m for um inteiro positivo, então G(1/m) = e Am, Uma, 
segunda aplicação de (30) mostra que se m e n forem inteiros positivos, 
então G(n/m) = e-^"/"^. Em outras palavras, G(y) = e- AY é válida para todo 
número racional positivo y. Pela continuidade à direita, segue-se que G(y) = е ^ 
para у 2 0. Isto implica que F = 1 — С é a função de distribuição exponencial de 
parâmetro A. 


5.3.3. DENSIDADES GAMA. Antes de definirmos as densidades gama em geral, 
discutiremos um exemplo em que elas surgem naturalmente. 
Exemplo 12. Seja X uma variável aleatória com densidade normal n(0, o?). 
Obtenha a densidade da variável aleatória Y = X?. 

Para resolver este problema observamos inicialmente que a densidade de X é 


1 
= а: A. А — oo со 
f(x) oNV 2n * X Ө, «x «ee, 


De acordo com a fórmula (13), Y tem densidade g dada por g(y) = O para 
у<0 e 


ut Si $ 
90) = 245 СУУ) + V»). y>0. 


Isto implica que 


1 А 
= -»/2 3 
(31) goes у * E PFO. 


Para definir densidades gama em geral, consideramos inicialmente funções 
g da forma 


a ааа — x9 
90) = 
0, x<o0. 
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Aqui exigimos que a > 0 е А > 0 para que g seja integrável. A densidade em 
(31) corresponde ao caso especial а = 1/2 e А = 1/20?. Na normalização de g 
para transformá-lo em densidade devemos avaliar 


oo 
c= Í X ed. 
0 


Fazendo a mudança de variável у = Xx, temos d 


с = — | We" dy. 
0 


Ae 


Não existe uma fórmula simples para a integral acima. Por isso ela é usada para 
definir uma função chamada função gama e é representada por Г. Assim 

1 

c = — I (a), 

A ( 

onde 
(32) Г = | "e diei 910. 
0 

A função normalizada chama-se densidade gama de parámetros а e À e é repre- 
sentada por T(a,A) ou Г(х; а, №). Vemos que 
tae ат" и 
T(a) 
0 10: 


, = 


(33) T(x; а, 4) = 


Deixamos também registrada a fórmula seguinte, que se mostrará útil no futuro: 


(34) [ gera, = АШ). 


^2 


0 5 


Аз densidades exponenciais sáo casos especiais de densidades gama. Especi- 
ficamente, a densidade de parâmetro А é a mesma que a densidade Г(1, X). Vimos 
também que а densidade dada por (31) é a densidade gama de parâmetros a = 1/2 
e A = 1/20?. Em outras palavras, se X tiver a densidade п(0, 0º), então X? 
terá a densidade gama T(1/2, 1/20?). Igualando (31) а (33) com а = 1/2e А 
à = 1/202, obtemos a útil relação 


(35) Г(1/2) = т. 
Uma importante propriedade da funcáo рата é que | 
(36) IT(a*1)-oI(o) «>0. 


Esta fórmula decorre de (32) por uma simples aplicação de integração por partes. 
Para sermos específicos 
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I(x + 1) = | xe dx 


= —Xg + |М puso ах 
10 0 
ea) 
a Como Г(1) = 1, segue-se facilmente de (36) que se n for um positivo inteiro, 
(37) Г(п) = (n — 1)!. 
| Segue-se também de (35) e (36), após algumas simplificacóes, que se п for um 


n positivo inteiro ímpar, então 
E (2) | van- 0)! 
2 qm (=) 


(38) 


Não existe uma fórmula simples para a função de distribuição correspondente 
a T(a, A) exceto quando а = т é um inteiro positivo. Neste caso podemos in- 
tegrar por partes e obter para x > 0 


[А aryr e 2 З (у) Че” х | |" ыйы айк йы 
3 m oi dz D ERN M E 

о (m—1) ^ (m — 1)! о do (т — 2)! 
= fx сазы de Aui £ (Ах) е^ 

Jo (m.— Di (m — 1)! 


desde que m 2 2. Se integrarmos por partes m — 1 vezes desta maneira e observar- 
mos que 


| je ду = 1 е; 
0 


obtemos a fórmula 


x 4jm,m—i,-—4Ay m-i komax 
(39) [E ar=1- (de 


SEA —— , x0: 

o (m — 1)! kzo k! 
Esta fórmula reflete uma interessante relação entre uma variável aleatória X com 
densidade gama: T(m, X) e uma variável aleatória Y com distribuição de Poisson 
de parâmetro Ах. Especificamente, (39) estabelece que 


rot 


(40) — аа Р(Х<х)=Р(Ү >т). 


Como veremos no Capítulo 9, esta relação é relevante à teoria dos processos de 
Poisson. 


133 


me 


О comportamento qualitativo da densidade gama, ilustrado na Figura 6, 
é facilmente obtido pelos métodos de cálculo. 


Figura 6. A Densidade Gama 


Uma importante propriedade das densidades gama é que se X e Y forem variáveis 
aleatórias independentes tendo densidades Г(«,, А) e I(a,, X) respectivamente, 
então X + Y {ега а densidade gama T(a, + 05, №). Este resultado será demonstrado 
no Capítulo 6. Esta e outras propriedades das densidades gama tornam sua mani- 
pulação bastante simples. Existem muitas situações práticas em que não se conhece 
a densidade de uma variável aleatória X. É possível que se saiba que X é uma 
variável aleatória positiva cuja densidade pode ser aproximada razoavelmente por 
uma densidade gama de parâmetros apropriados. Em tais casos, resolvendo um 
problema envolvendo X, sob a hipótese que X tenha uma densidade gama, pro- 
porcionará uma aproximação ou pelo menos uma compreensão melhor da situação 
real desconhecida. 


5.4. FUNÇÕES INVERSAS DE DISTRIBUIÇÃO 


Importantes aplicações das fórmulas de mudança de variáveis da Seção 5.2.1. 


podem ser obtidas relacionando a função y à função de distribuição F. 

Seja X uma variável aleatória contínua tendo função de distribuição F 
e função de densidade f. Aplicaremos a fórmula de mudança de variável à função 
y =F. Se у = F(x), então dy/dx = F'(x) = f(x)-e portanto dx/dy = 1/ f(x). 
Assim de acordo com (18), a variável aleatória Y = F(X) tem densidade g onde 


i ш 


g(y) = ДО Т Qe 318 
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е g(y) = O para outros valores de Y. Em outras palavras, a variável aleatória 
Y — F(X) distribui-se uniformemente em (0,1). Este resultado é válido mesmo 
que a função y = F não satisfaça todas as hipóteses do Teorema 1. Usando um 
argumento direto, pode-se mostrar que se X é uma variável aleatória contínua 
com função de distribuição F, então F(X) distribui-se uniformemente em (0, 1). 
(Se F for descontínua em algum ponto хо, então P(X = хо) > 0, de modo que 
P(F(X) = F(X9)) » 0 e F(X) não poderia distribuir-se uniformemente em (0, 1).) 

Pode-se também prosseguir em outra direção. Seja F uma função de dis- 
tribuição contínua que é estritamente crescente em algum intervalo Z e tal que, 
F = 0 à esquerda de / se Z for limitado inferiormente e, F = 1 à direita de 7 
se / for limitado superiormente. Então para 0 < y < 1, pelo teorema do valor 
médio de cálculo, existe um único valor de x tal que y = F(x). Assim Е! (у), 
0 «€ y < 1, é bem definida. Sob estas condições, se Y for uma variável aleatória 
uniformemente distribuída em (0,1) então a variável aleatória F-!(Y) tem Е 
como sua função de distribuição. 


Pode-se usar dois exemplos da Seção 5.2.1 para ilustrar o resultado acima. 
No Exemplo 6 obtivemos variáveis aleatórias exponencialmente distribuídas como 
transformadas de uma variável aleatória uniformemente distribuída. O leitor po- 
deria checar e veria que estas transformações poderiam ser obtidas pelo método do 
parágrafo acima. No Exemplo 11 mostramos que se O for uniformemente dis- 
tribuída em (—7/2. 7/2), então tg O terá a distribuição de Cauchy. Suponha 
que Y se distribua uniformemente em (0. 1). Então Ө = nY — 7/2 distribui- 
se uniformemente em (—7/2. 7/2), de modo que 


X=tgO=tg (nr = 7) 


terá a distribuição de Cauchy. Este é exatamente o que obteríamos usando o re- 
sultado do parágrafo anterior. De acordo com o Exemplo 10, a função de distri- 
buição de Cauchy é dada por 


F(x) = à 3. L свх, — co <x < оо, 


e a equação у = F(x), ou 


p=5+ L arctg Sos 


tem a solução 


л 
хе) (лу — 7). 
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Paez alguns propósitos é desejável gerar uma variável aleatória X tendo uma 
Sumção de distribuição pré-estabelecida F. Uma maneira de fazê-lo é gerar inicialmente 
uma variável aleatória uniformemente distribuída Y e então fazer X = F7! (Y). 
Este método é especialmente útil em computadores digitais já que existem métodos 
Dastante satisfatórios para gerar (о que se comporta como) variáveis aleatórias uni- 
formemente distribuídas em tais computadores. Suponha por exemplo que dese- 
jamos uma rotina para gerar uma variável aleatória X com densidade normal padrão 
n(0,1). Usaríamos uma sub-rotina para gerar uma variável aleatória Y unifor- 
memente distribuída em (0,1) e uma sub-rotina para computar a função numérica 
Ф-!, e então determinar X = Ф -! (Y). Para gerar uma variável aleatória X tendo 
a densidade normal n(u, о?) faríamos X = u + ob! (Y). 

As funções inversas de distribuição são úteis para outros propósitos. Su- 
ponha por exemplo que X tenha a densidade normal n(u, о?) e lembre-se da 
Seção 5.3.1. que 


cal5-H 
вх) ( 2 ) 


Suponha que desejamos escolher b tal que Р(Х < b) = 0,9. Precisamos resolver 


em b a equação 
Ф (224) = 09. 
0 - 


A solução é dada por 


ou 
b = u + oġ™! (0,9). 
Da Tabela I vemos que 6"! (0,9) = 1,28. Assim b = u + 1,280 e 
Р(Х € и+ 1,280) = 0,9. 


Em estatística aplicada o número b = u + 1,280 chama-se decil superior da 
distribuição n(u, o? ). 

Seja F uma função de distribuição qualquer que satisfaz as condições para 
que F^! (y), 0 € y < 1, seja bem definida, conforme a discussão acima. Então 
т = F-!(1/2) chama-se mediana de Е, Е-!(3/4) e Е-!(1/4) chama-se quartis 
superior e inferior de F, Е-!(0,9) chama-se decil superior e F-!(k/100) chama-se 


ез ) А 


k-percentil superior. Estas definições podem ser modificadas para aplicá-las à função 
arbitrária de distribuição, e em particular as funções discretas de distribuição. 

Se X tiver uma densidade simétrica então X terá claramente a mediana 
т = 0. Para um exemplo mais interessante, seja X uma variável aleatória ex- 
ponencialmente distribuída com parâmetro A. Então sua mediana é dada por 
1 — ет = 1/2, que tem a solução т = A^! log 2. Suponha que X represente 
o tempo para uma partícula radioativa se desintegrar. Então se tivermos um número 
bastante grande de tais partículas, esperaremos que a metade das partículas tenham 
se desintegrado até o tempo m. Em física este tempo chama-se meia-vida da par- 
tícula. Se observarmos a meia-vida m poderemos usá-la para determinar a taxa de 
desintegração A = m^! log 2. ў 

Para uma aplicação final das funções іпуегѕаѕ de distribuição, seja X uma 
variável aleatória com densidade normal n(u, о?) e suponha que desejamos de- 
terminar a > 0 tal qe Р(и— a < X < и+а) = 0,9. Então de acordo com (25) 
precisamos resolver em a a equação 


Como $(—x)-1-— Ф(х) para todo x, temos 


20 В — 1209 
o 


e portanto а = оФ-! (0,95). Da Tabela I vemos que Ф! (0,95) = 1,645. Em 


outras palavras, 
P(u — 1,6450 SX < u + 1,6450) = 0,9. 
Usando a mesma técnica obtemos 
P(u – 0,6750 < X & yu + 0,6750) = 0,5 
ou equivalente, 
P(IX — u | < 0,6750) = 0,5 


Isto indica que se X tiver a densidade normal n(u, 02), então X deferirá de 
u por menos de 0,6750 com probabilidade um meio e por mais de 0,6750 com 
probabilidade um meio. Se pensarmos em и como uma quantidade física reale X 
como uma medida de u, então | X — u| representa o erro de medida. Por esta 
razão 0,6750 é conhecido como o erro provável. 
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Exercícios 


118 


. беа X uma variável aleatória tal que P(|X — 1 |= 2) = 0. . Expresse 


P(|.X — 1 | > 2) em termos da função de distribuição Fy. 


. Considere um ponto escolhido aleatoriamente no interior de um disco de raio R 


no plano. Seja X o quadrado da distáncia do centro do disco ao ponto es- 
colhido. Obtenha a função de distribuição de X. 


. Considere um ponto escolhido uniformemente numa bola sólida de raio R 


no espaço tridimensional. Seja X a distância do centro da bola ao ponto 
escolhido. Obtenha a função de distribuição de X. 


. Considere um ponto escolhido uniformemente no intervalo [0,4]. Seja X 


a distância da origem ao ponto escolhido. Obtenha a função de distribuição 
de X. 


. Considere um ponto escolhido uniformemente no interior de um triângulo de 


base 1 е altura й. Seja X a distância da base ao ponto escolhido. Obtenha a 
função de distribuição de X. 


. Considere um triângulo eqüilátero de lado s. Seja um ponto escolhido uni- 


formemente sobre um lado do triângulo. Seja X a distância entre o ponto 
escolhido e o vértice oposto. Obtenha a função de distribuição de X. 


. Seja o ponto (и, v) escolhido uniformemente no quadrado 0 < u < 1, 


0<v<1. Seja X a variável aleatória que associa o número и +v ao ponto 
(u,v). Obtenha a função de distribuição de X. 


. Seja F a função de distribuição dada pela fórmula (3). Obtenha um número 


m tal que F(m) — 1/2. 


. Seja X o tempo até a desintegração de alguma partícula radioativa e suponha 


que a função de distribuição de X é dada pela fórmula (3). Suponha que 
A seja tal que P(X > 0,01) = 1/2. Obtenha um número f tal que 
P(X2t)- 09. 


. Seja X a variável aleatória do Exercício 4. Obtenha a função de distribuição 


de Y=Min(X,a/2). 


Seja X uma variável aleatória cuja função de distribuição F é dada por 


e 
x 
ә 


о 
A 
x 
^ 


F(x) = 


A 
x 
^ 
Tes 


d 
3 
* 
2 
1 


x 
IV 
N 


15. 


12. 


13; 


14. 


Determine: 
(а) P(1/2& X € 3/2); 

(b) P(1/2« X€ 1); 

(с) P(1/2& X € 1); 

(d) P(1&X « 3/2); 

(е) P(1« X « 2). a 

Se a função de distribuição де X- fosse definida de uma das formas abaixo, 
descreva como as ора (1)—(1у) da Seção 5.1.1 teriam de ser modificadas 
em cada caso: 

(a) F(x)-P(X <x); 

(b) F(x) - P(X >x); 

(c) F(x) - P(X >x). 

Escolhe-se aleatoriamente um ponto em (—10, 10). Seja X ита variável 
aleatória definida de tal forma que X represente a coordenada do ponto se 
o mesmo estiver em [—5, 5], X — —5 se o porito estiver em (—10, —5) e 
X = 5 se o ponto estiver em (5, 10). Obtenha a função de distribuição de X. 
Seja X uma variável aleatória contínua tendo a densidade de f dada por 


у= Be BI eo x « co, 


Obtenha P(1 < < 2). 
Seja F a h»c de AEN definida por 


1 X 
Е(х) = uo Xll + D' —oo Lx < оо, 


Obtenha uma densidade f para F. Para que valores de x teremos 


F'(x) = (х)? 


. Obtenha uma função de densidade para a variável aleatória do Exercício 3. 
. Obtenha uma função de densidade para a variável aleatória do Exercício 7. 
. Seja X uma variável aleatória contínua de densidade f. Obtenha uma fórmula 


para a densidade de Y = | X |. 


. Sejam X e Y = X? duas variáveis aleatórias contínuas positivas tendo den- 


sidades f e g, respectivamente. Obtenha f em termos de. g e g em termos 


de f. 


. Suponha que X se distribui uniformemente em (0, 1). Obtenha а densidade 


de Y = Х1/8, onde 8 * 0. 


. Seja X uma variável aleatória contínua positiva de densidade f. Obtenha 


uma fórmula para a densidade de Y = 1/(Х + 1). 


. Seja X uma variável aleatória, g uma função de densidade em relação à inte- 


gração e ø uma função diferenciável estritamente crescente em (—%, оо), 
Suponha que 
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23. 


24. 


25, 


26. 


2 


28. 


29: 


30. 


ST. 


32. 


33. 


34. 


35. 


36. 


(x) 
g(z) dz, —o0 < X < ob. 
со 


px хә) f 


Mostre que a variável aleatória Y = o(X) tem densidade g. 

Seja X uma variável aleatória com distribuição uniforme em (a, b). Obtenha 
uma função linear y tal que Y = o(X) tenha distribuição uniforme em (0, 1). 
Suponha que X tenha uma densidade exponencial de parâmetro А. Obtenha 
a densidade de Y = cX, onde c 0. 

Seja g(x) = x(1 - x), 0<х <1, e g(x) = 0 para outros valores de x. 
Como se deve normalizar g para transformá-la em uma densidade? 

Suponha que X tenha a densidade de Cauchy. Obtenha a densidade de 
Ү=а+ЬХ, Ь +0. 

Seja X о seno de um ângulo escolhido aleatoriamente em (—1/2, 7/2). 
Obtenha a densidade e a função de distribuição de X. 

Seja X uma variável aleatória contínua com densidade simétrica f e tal que 
X? tenha uma densidade exponencial de parámetro А. Obtenha f. 

Seja X uma variável aleatória contínua tendo uma função de distribuição 
F e uma função de densidade f. Diz-se então que f é simétrica em relação 
aa se f(atx)-—f(a—x) —°°< х < °°. Obtenha as condições equivalentes 
em termos de variável aleatória X e em termos de função de distribuição F. 


Define-se a função de erro por 
er) = —- | e “dy, — 0 < x < 00. 
n «0 


Expresse Ф em termos de função de erro. 

Suponha que X tem a densidade normal 7(0, о>). Obtenha a densidade 
de Y —|X|. 

Suponha que X tem a densidade normal n(u, 0°). Obtenha a densidade de 
Y — eX, Esta densidade chama-se densidade log normal. 

Suponha que X se distribui normalmente com parámetros и e 0?. Obtenha 
P(IX —u|&o). 

Suponha que X se distribui normalmente com parâmetros и e о?. Determine 
os números а e b tais que a + БХ tenha a densidade normal padrão. 

Suponha que X se distribui normalmente com parámetros u= 0 e 0? — 4. 
Seja Y uma variável aleatória inteira definida em termos de. X por Y =m 
se m —1/2« X «mt 1/2, onde m é um número inteiro tal que —5 <m <5, 
Y = —6 se X<-55eY=6 se X2 5,5. Obtenha fy e faça um gráfico 
desta densidade. 

Suponha que o peso de uma pessoa selecionada ao acaso de uma certa população 
distribui-se normalmente com parámetros и e о. Suponha também que 
Р(Х < 160) = 1/2 e P(X < 140) = 1/4. Obtenha и e o e determine 


P(X > 200). De todas as pessoas pesando no mínimo 200 libras, que percen- 
tagem pesará mais de 220 libras? 

37. Seja t, um nümero tal que S(s )=р, 0 <р < 1. Suponha que X tema 
фен normal n(u, o? ) Шы que para 0<р,<р,<1, 


P(u*ttyj 0<X<utt, 0)7p3 —Di. 


38. Suponha que um nümero bastante grande de partículas radioativas idénticas 
tenha tempo de desintegração que se distribua exponencialmente com um 
certo parâmetro А. Se a metade das partículas se desintegram no primeiro 
segur do, quanto tempo levará para 75% das partículas se desintegrarem? 

39. Suponha que X se distribui exponencialmente com parâmetro A. Seja Y 
a variável aleatória inteira definida em termos de X por Y=m se 
m & X < m + 1, onde т é um número inteiro não-negativo. Como se dis- 
tribui Y? 

40. Seja T uma variável aleatória contínua positiva que representa o tempo de 
falha de um certo sistema, seja F a função de distribuição de Т e suponha 
que F(f)« 1 рага 0< t < •. Então podemos escrever F(t) = 1 —e- € (5, 
t2 0. Suponha que G (1) = g(t) existe para t> O. 


(a) Mostre que Т tem densidade f dada por 


iX =g(t),  0«t«e. 


A função g é conhecida como “аха de falha”, pois heuristicamente 


P(t<T<t+dt|T>t)= I = g(t) dt. 


(b) Mostre que para s>0 e £0, 


PMT>t+s|iT>t)=ef «m d 
(c) Mostre que o sistema melhora com a idade (isto é, para um s fixo a 
expressão em (b) cresce com f£) se g for uma função decrescente, e o 
sistema deteriora com a idade se g for uma função crescente. 
(d) Mostre que 


|7 g(u) ди = о 


i (e) Como se comporta g se T tem distribuição exponencial? 
(f) Se G(t) = №, > 0, para que valores de а o sistema meMora, deteriora 
e não se altera com a idade? 
41. Suponha que X tem a densidade gama Г(о, №). Obtenha a densidade de 
Y —cX, onde c 0. 
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42. 
43. 


44. 


45. 


46. 


47. 


48. 
49. 


50. 


Mostre que se «> 1, a densidade gama tem um máximo em (a — DA. 
Suponha que X tem a densidade gama Г(а, A). Obtenha a densidade de 
Y X. 

Suponha que Y se distribui uniformemente em (0,1). Obtenha uma função 
y tal que X = (Y) tenha a densidade f dada por f(x) = 2x, 0<x<1 
e f(x) = 0 para outros valores de x. 

Suponha que Y se distribui uniformemente em (0,1). Obtenha uma função 
p tal que (Y) tenha a densidade gama Г(1/2, 1/2). Sugestão: use o 
Exemplo 12. 

Determine ^!(f) para t = 0,1;0,2;...:0,9 e use estes valores para cons- 
truir um gráfico de ^. 

Suponha que X tem a densidade normal n(u, o^). Obtenha o quartil su- 
perior de X. 

Suponha que X tem a densidade de Cauchy. Determine o quartil superior de X. 
Suponha que X tem a densidade normal com parâmetros u e g^ 125. 
Determine uma constante c tal que 


P(IX—u|&c)- 09. 


Seja X uma variável aleatória inteira com função de distribuição F, e suponha 
que Y se distribui uniformemente em (0,1). Defina a variável aleatória inteira 
Z em termos de Y por 


Z=m se F(m—1)«Y «F(m), 


Para qualquer inteiro 7. Mostre que Z tem a mesma densidade de X. 


VARIÁVEIS ALEATÓRIAS 
COM DISTRIBUIÇÃO CONJUNTA 


Nas primeiras três seções deste capítulo discutiremos um par de variáveis alea- 
tórias contínuas X e Y e algumas de suas propriedades. Nas quatro seções restantes 
consideraremos as extensões de duas para п variáveis aleatórias X4, X4,..., Xs. 
A discussão de estatísticas de ordem da Seção 6.5 é opcional e não será necessária 
nos capítulos subsequentes deste livro. A Seção 6.6 é essencialmente um resumo dos 
resultados de distribuições amostrais que são úteis na estatística e serão necessários 
no Volume II. O material coberto na Seção 6.7 será usado somente па demonstração 
do Teorema 1 do Capítulo 9 e Teorema 1 do Capítulo 5 do Volume II. 


6.1. PROPRIEDADES DAS DISTRIBUIÇÕES BIDIMENSIONAIS 


Sejam X e Y duas variáveis aleatórias definidas no mesmo espaço de proba- 
bilidade. Define-se a sua função de distribuição conjunta F por 


F(x, y)  P(X &x,Y <y), —oeo« x,y < оо, 
Para ver se F é bem definida, observe que (c/X(c) € x) e (c/Y (o) € y ) am- 


bos são eventos já que Х e У são variáveis aleatórias. A sua união (w/X(w)<x 
e Y(w) < y] é também um evento, e portanto sua probabilidade é bem definida. 


Pode-se usar a função de distribuição conjunta para calcular a probabilidade 
de que o par (X, Y) esteja em um retângulo no plano. Considere o retângulo 
R = {(х,у)|а<х<Ь,с<у<а}, 

onde a & b е c &d. Então 
(1) P((X, Y)eR)-P(aC« X&b,c« Y d) 


= F(b,d) — F(a,d) — F(b,c) + F(a,c). 
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Para verificar que (1) é verdadeiro, observe que 


P(a« X&b,Y «d) - PX«b,Y «d) —P(X €a,Y <d) 
= F(b,d) — F(a, d). 
Analogamente 
P(a « X &b, Ү<с) = F(b,c) — Е(а, с). 
Assim 


Pla <A «b.e у а) 


Pla<X<bY<a)-Pa<x<bY<o 
(Fio, d) Faadh = (Mb, е) = Fa, cy) 


e portanto (1) é verdadeiro como desejado. 
As funções de distribuição unidimensional Fy e Fy definidas por 
Еу(х)=Р(Х<х) e  FyQ)- K(Y&y) 
são chamadas de funções de distribuição marginal de X e Y. Elas se relacionam 
com a função de distribuição conjunta F através de 


Fido) = ЕОс о) = hm F(x, y) 


y-*oo 
Еу) = Е(оо, y) = lim Р(х, y). 


Se existir uma função não-negativa f tal que 
x ру \ 
(2) о) = | | f(u, v) do) du, = «X. y « t0, 


então f é chamada de função de densidade conjunta (em relação a integração) 
da função de densidade conjunta F ou do par de variáveis aleatórias X e Y. 
A menos que se especifique em contrário, usaremos ao longo de todo este capítulo 
o termo funções de densidade para fazer referência a funções de densidade em 
relação à integração em vez de funções de densidade discreta. 

Se F tiver densidade f, podemos reescrever a Equação (1) em termos de f, 
obtendo 


^b ^d 
(3) Pa < X < b,c < Y < d)= | (| 105 9) dy) а 


Usando as propriedades da integração e a definição de espaços de probabilidade, 
pode-se mostrar que a relação 


(4) Р(Х, Y)e A) = Гло, y dz dy 


yT 


se verifica para subconjuntos А no plano do tipo considerado em cálculo. Fazendo 
A representar todo o plano, obtemos de (4) que 


(5) e [ж y) dx dy = 1. 
Obtemos também de (4) que 

Ех) = P(X < x) = [ ПЕ Аи, у) dy) du 
de modo que Fy tem densidade marginal fy dada por 


ло) = | fe» 


que satisfaz 
rj) = [^ ле) du 
Analogamente Fy tem densidade marginal fy dada por 
КО = |> f(x, y) dx. 


Como no caso unidimensional, f nào é unicamente definida por (2). Pode- 
mos alterar f em um nümero finito de pontos ou mesmo sobre um nümero finito 
de curvas suaves no plano sem afetar a integral de f sobre subconjuntos do plano. 
Novamente como no caso unidimensional, F determina f nos pontos de conti- 
nuidade de f. Pode-se obter este fato de (3). 

Diferenciando (2) e aplicando as regras de cálculo obtemos 


д = ga 
p Fe»- f- E Foro p D du 
- [лауа 
e 
ð? 
(6) Эх ду F(x, y) = f(x, y). 


Sob algumas condições brandas adicionais podemos justificar estas operações e 
mostrar que (6) é válido nos pontos de continuidade de f. Em casos específicos, 
em vez de verificar se as etapas que conduzem a (6) são válidas, é geralmente mais 
simples mostrar que a função f obtida de (6) satisfaz (2). 

Exemplo 1. Ilustraremos as definições e fórmulas acima reconsiderando o Exemplo 1 
do Capítulo 5. Lembre-se que naquele exemplo escolhemos uniformemente um 
ponto de um disco de raio R. Suponha que os pontos do plano são determinados 
por suas coordenadas cartesianas (x, у). Então o disco pode ser representado como 


(Gy) 1x? + у? < R*). 
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Sejam X e Y as variáveis aleatórias que representam as coordenadas aleatórias 
do ponto escolhido. Correspondendo à hipótese de uniformidade, supomos que 
X e Y tem densidade conjunta f dada por 


1 2 2 : 

—, eso po 455 M 
(7) f(x, у) = | 

0, outros valores de x е y. 
Entáo para qualquer subconjunto А do disco (digamos do tipo considerado em 
cálculo), 

Р(Х, Y)e А) = | | f(x, y) dx d) 
A 
_ áreade А 
ХЕ? C 


que concorda com nossa hipótese de uniformidade. A densidade marginal fy 
é dada por 


VR2-x2 1 ^ Г ааг" 

: 2X R^ — x 

| = ау = —— 
dax з яК? 


Ао = [^ ла = 


para —R <x < К e fx(x) = 0 para outros valores de x. A densidade marginal 
fy(y) é dada pela mesma fórmula com y substituindo x. 

Diz-se que as variáveis X e Y são variáveis aleatórias independentes se 
а<Ь е с<а4, então 


(8) P(a« X&b,c«Y €d)- P(a« Х<Ь)Р(с< Ү<а). 


sempre que а = c = —9, b = х, e d = y, segue-se que se X e Y forem inde- 
pendentes, então 


(9) F(x, у) = Еұ(х)Еуү(у), —=< х,у L, 


Reciprocamente (9) implica que X e Y são independentes. Pois se (9) for ver- 
dadeiro, entáo de acordo com (1) o primeiro membro de (8) é 


F(b, d) — F(a, d) — F(b, c) + F(a, c) 

Fx(b)F;(d) — Fx(a)F;(d) — Fe(b)Fy(c) + Fe(a)Fy(o) 
(Fx(b) — Fy(a)(Fy(d) — Fy(c) 

Pa < X < DP < Y < 4). 


Ш 


Ш 


Pode-se mostrar de uma forma mais geral que зе X e Y forem independentes 
e A e B forem unióes de um nümero finito ou infinito enumerável de intervalos, 
então ( 


a 


P(X€A,Y€B)-P(X€AMXY €B) 
ou em outras palavras os eventos 
{о1Х(о)Є A) e (w|lX(w)EB) 
seráo eventos independentes. 
Sejam X e Y variáveis aleatórias tendo densidades marginais fy e fy. Então 
Й X e Y são independentes se, e somente se, а função f definida por 


Рх, у) = fx (х) fy), 789600,0 9, 


for uma densidade conjunta para X e Y. Isto é uma consequência da definição 
de independência e da fórmula 


+ FEO) = | (F AORO do) du 


Como uma ilustração de variáveis aleatórias dependentes, sejam X e Y as 
variáveis definidas no Exemplo 1. Então para -R «x <А e —R«y«R, 


VR Lx JRR 


п? R^ 


ао) AOO) = É 
que não concorda com a densidade conjunta dessas variáveis aleatórias no ponto 
x = 0, у = 0. Como (0,0) é um ponto de continuidade das funções definidas 
por (7) e (10), segue-se que X e Y são variáveis aleatórias dependentes. Isto 
está de acordo com a nossa noção intuitiva de dependência, pois quando X está 
próximo de R, Y deve estar próximo de zero, e assim informação sobre: X nos 
dá informação sobre Y. 

Pode-se definir diretamente as funções de densidade, como vimos em outros 
contextos. Uma função de densidade bidimensional f é uma função não-negativa 
em R? tal que 


[ [ dix pd dy = i. 


Correspondendo a qualquer função de densidade bidimensional existem um espaço 
de probabilidade e um par de variáveis aleatórias X e Y definidas neste espaço 
` cuja densidade conjunta é f. 
A maneira mais fácil de construir funções de densidade bidimensional é a 
partir de duas densidades unidimensionais f; e fọ e definir a função f através de 


(11) fæ = fi C9 fa), әк; 


Então, f será uma função de densidade bidimensional já que ela é claramente 
não-negativa e 


E E f(x, y) dx dy = p fix) dx [А f) dy = 1. 
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Se ав variáveis aleatórias X e Y tém f como sua densidade conjunta, entáo X e Y 
são independentes e têm densidades marginais fy —f, e fy —f;. 
Como uma ilustração de (11), suponha que f, e f; são ambas densidade 
normal padrão n(0,1). Então f é dada por 
1 


1 
= =? — y? [2 
f(x,y) V27 e Var e 
ou $ 
(12) Дх) = e CD, cm x ym 
A densidade dada em (12) chama-se densidade normal bidimensional padrão. No 
exemplo seguinte modificaremos um pouco o segundo membro de (12) para obter 


ta 


uma função de densidade conjunta que corresponde ao caso em que as duas variáveis 
aleatórias tendo densidades marginais normais são dependentes. 


Exemplo 2. Suponha que X e Y têma função de densidade conjunta f dada por 
f(x,y) = ce- &* -xyt*y*)2. —o<L х,у < оо, 
onde c é uma constante positiva que será determinada no decorrer de nossa dis- 
cussão. Inicialmente “completamos o quadrado” em termos envolvendo y e reescre- 
vemos f como 
f(x; y) = ce I0 -x/2Y +3002. coca patos, 

e entáo observamos que 

oo fal 

лод = [^ Tapoca |7 его—чат ау 

— оо = 00 

Fazendo a mudança de variável u = y — x/2, vemos que 


oo 5 oo E = 
EEN d 
Í eco va dy = | е“? du = V2x. 


-0 = с 


Conseqüentemente 
Убх) = су Tne- 3х° /8, 


Agora toma-se claro que fy é a densidade normal n(0, 0?) com o? = 4/3 е 
portanto 


ra 


1 уЗ 
су 21 = = === 
cr: 2X 2n 


ou c =y 3/47. Conseqüentemente 


(13) fex, y)-7 Уз, (x? —ху+у®/2, —юо<х,у< оо, К 
T 


podemos mostrar que fy é também n(0, 4/3). Como f(x, y) = fx(x) fy (y), 
é claro que X е Y são dependentes. 


Os cálculos acima mostram que fy é a densidade normal n(0, 4/3). Analogamente 
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6.2. DISTRIBUIÇÃO DE SOMAS E QUOCIENTES 


Sejam X e Y variáveis aleatórias tendo uma densidade conjunta f. Em muitos- 


contextos temos uma variável aleatória Z definida em termos de X e Y e dese- 
jamos determinar a densidade de Z. Suponha que Z seja dada por Z = Y(X, Y), 
onde y é uma função real cujo domínio contém o contradomínio de X e Y. 
Para um 2 fixo o evento {Z < 2} é equivalente ao evento ((X, Y)€ А, }, onde 
А, é o subconjunto de R? definido por 

A; = {(х,у)1ф(х,у)<& zt 
Assim 

Fg(z) = Р(2 < 2) 


P(X, Y) e A) 


fre » ax. 


Se pudermos obter uma função não-negativa g tal que 


[ f(x, y) dx dy = f g(v) dv, —00-« Z < о, 

Az es 
então g será necessariamente uma densidade de Z. Usaremos este método para 
obter as densidades de X+Y e Y/X. 


6.2.1. DISTRIBUIÇÃO DE SOMAS. Seja Z = X + Y. Então 
Az = {(х,у)|х+у<2} 


é simplesmente o semi-plano à esquerda inferior da reta х + y = 2 como mostra 


` a Figura 1. Assim 


Fij = | | f(x, у) dx dy = y ( [re ) dy) die 


Fazendo a mudança de variável y — v — x- na integral interna temos 


Pia = Es (] Ж 0 х) do) is 


= fes (P. ros v— x) dx) dv, 


onde invertemos a ordem de integração. Assim a densidade de Z = X + Y é dada por 


(14) odes F юзе РЬ aara 
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Figura 1 


Na maioria das aplicações de (14), X e Y são independentes e pode-se reescrever 
(14) como 


(15) Jara = N ЛО) — x) dx, -0 < 2 < о. 


Se X e Y forem variáveis aleatórias independentes não-negativas, então 
fx«y(2) = 0 para z<0 e 


(16) [M |. poe 


O segundo membro de (15) sugere um método de obter densidades. Dadas 
duas densidades unidimensionais f e g, a função h definida por 


hz) = n fG)g(z — x) dx, = <2 < o, 


é uma função de densidade unidimensional que se chama convolução de f e g. 

Assim a densidade da soma de duas variáveis aleatórias independentes é a convolução 

das densidades individuais. 

Exemplo 3. Sejam X e Y variáveis aleatórias independentes, cada uma com a 

densidade exponencial de parâmetro А. Obtenha a distribuição de X + Y. [ 
A densidade de X é dada por fy(x) = he ^ para x 2 0 e fy(x) = 0 | 

para x < 0. A densidade de Y é a mesma. Assim fy.,y(z) = 0 para z <0 e, 

de acordo com (16), para z > 0 i 


fx«Y2) = | Де Дел ax. | 
0 
| 


2 
= е dx = ze. 
0 


Vemos que Х+ Y tem a densidade gama Г(2, А). 
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Exemplo 4. Suponha- que X e Y se distribuem independente e uniformemente 
em (0, 1). Obtenha a densidade de. X * Y. 

A densidade de X é dada por fy(x) = 1 para 0 <х « 1 e fxyx(x) = 0 
para outros valores de x. A densidade de Y é a mesma. Assim fy+y(z) = 0 
para 2 < 0. Рага z > 0 aplicamos (16). O integrando fy(x) fy(z — x) assume 
apenas os valores de Ое 1. Ele assume o valor 1-ѕе x e z são tais que 0О<х<1 
e 0<2-х<1. Se 0<2 < 1, o integrando tem valor 1 no intervalo 0 <x «2 
e zero caso contrário. Portanto obtemos de (16) que E 

fx«y(27z, 0<2<1. 


f Se 1 <z <2, o integrando tem valor 1 no intervalo z — 1 <x < 1 e zero caso 
contrário. Assim, de acordo com (16) 
fx«y(27»2-2, 1<2<2. 
| Se 2«z < v, o integrando de (16) é identicamente zero e portanto 
fx+y()=0, 2<2<=, 


O gráfico de f é dado na Figura 2. Pode-se também obter'a densidade de X+ Y 
determinando a área do conjunto 


| 
| Em resumo 
Н 
| T2 Qr |8 
| Љу) = {2 = 2, Iz = 2, 
| 0, para outros valores de x. 
| fxiv 

[0] 1 : 2 

Figura 2 


А, = {0,у)10<х<10<7<1 e x+y<z) 


| (ver Figura 3) e diferenciando o resultado em relação a z. 


Ое 1 1<г2=2 


Figura 3 
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O Exemplo 3 tem uma importante generalização, que se pode formular 
como segue. 

Teorema 1. Sejam X e Y variáveis aleatórias independentes tais que X 

tem a densidade gama Г(0;, A) e Y tem a densidade gama T(a,, X). Então 

X * Y têm a densidade gama 


Г(о; + а, A). 


Demonstração. Observamos que X e Y são variáveis aleatórias positivas e que 
Au xn = lg-àx 


Bec AE. 25 8 10 


ду te Ay 
I(a;) 
Assim fx + у(2) = 0 para z <0 е, de acordo com (16), para z > 0 


[у= у> 0. 


f (2) E Ae taçodz PE 8 хуз! En 
Pro Tede) Jo l 


Fazendo a mudança de variável x — zu (com dx =z du) na integral acima, obtemos 
(17) Jaro = GA ota 2 >10, 
onde 
[ие Q = uA du 

I(o,)I(a;) 
Pode-se determinar a constante c pelo fato de que a integral de fy + y é 1. De (17) 
e da definição de densidades gama torna-se claro que fy+y deve ser a densidade 
gama F(a; + а, A) como foi afirmado. 

De (17) e da definição de densidade gama vemos também que с = 1/Г(о; + оз). 


Isto juntamente com (18) permite-nos determinar a integral definida que aparece 
em (18) em termos de função gama: 


(18) c= 


1 
(19) | ще Ah п) du = T(o,)I(a;) Y 

0 T(a, + &2) 
Esta fórmula permite-nos definir outra família de densidades com dois parâmetros 
chamadas densidades Beta. A densidade Beta de parámetros o, e œ, é definida por 


[Te + @)х (1 — xy 


| I(a,)I (a7) 
0, para outros valores de x. 


: Que 2 


(20) fx) = 


A razão desta terminologia é que a função de o4, e o; definida por 


FU GG 


Bes dre 
uet d ay 


0 « 01.9, < бо, 
chama-se função beta. 
Nossa aplicação final da fórmula de convolução será à variáveis aleatórias 
normalmente distribuídas. 
Teorema 2. Sejam X e Y variáveis aleatórias independentes com densi- 
dades normais n(u,, 02) e n(u5, 02), respectivamente. Então X * Y tem 
a densidade normal 


п(ш * 5, 01 +03). 


Demonstração. Suponhamos inicialmente que и, = џи, = 0. Então 


1 —х?/2в1 
fx(x) = zs e -0 < x < 00, 
01N 2x 
e 
1 —у2/2в% 
HO) = ао << о, 
с,У 21 
Assim de acordo com (15) 


1 © Lixo (@— 221 
і Јх+ E m d . 
{ э) 210,02 i € | 2 bs * ci T 


Infelizmente a determinação desta integral requer alguns cálculos laboriosos (que 
não são suficientemente importantes para justificar seu domínio). Uma das maneiras 
de proceder é fazer inicialmente a mudança de variável 


f. 2 
ої to 
ACC КЕ a 


эй 01 02 


Após algumas transformações algébricas obtemos 
© 2 
Jx+x(z) = M Бус: | ехр [-> G AUI Ed 2 du. 
2n o? + 02 )-%ә 2 oo? + 02 0; 
A seguir completamos o quadro em u e observamos que 


2 2uze, go 26} 2 z^ 
U m5 us =—=== is zu 
ovo? +o 0j oo? + о? сү t 03 


Então fazendo uma segunda mudança de variável 


Z0, 
$-—-u———————, 


ovo? + о? 
vemos que 
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fx«x(2) = 


е-2212091+03) o ы? 
—— dv 


Van oi 462-9 2n 


e P2601 o3) 
V2nN o? + o 
que é simplesmente a densidade normal n(0, 0? + 03). 
No caso geral X — и, e У – w são independentes e têm densidades normais 
n(0, 02) e n(0, o2), respectivamente. Assim de acordo com o caso especial 


acima, (X — u)+(Y-u,))=X+Y-(u,+u>) têm a densidade normal 
n(0, 01 + 03), e portanto X+ Y têm a densidade normal 


п(щш + u3,01 +03) 


como afirmamos. 

A demonstração acima é elementar porém trabalhosa. Uma demonstração 
menos computacional envolvendo técnicas mais avançadas será dada na Seção 8.3. 
Outra demonstração é indicada no Exercício 36 no final deste capítulo. 

Exemplo 5. Sejam X e Y variáveis aleatórias independentes cada uma com 
densidade normal n(0, o?). Obtenha as densidades de X+Y e Х? +Y?. 

Pelo Teorema 2 vemos de imediato que X + Y têm a densidade normal 
m0, 20º). De acordo com o Exemplo 12 do Capítulo 5, X? e Y? têm indivi- 
dualmente a densidade gama Г (1/2, 1/207). Vê-se facilmente que X? e Y? 
são independentes. Assim, pelo Teorema 1, X? + Y? têm a densidade gama 


Г(1, 1/26? ) que é também a densidade exponencial de parámetro 1/20? . 


6.2.2. DISTRIBUIÇÃO DE QUOCIENTES.* Suponha que X e Y representam 
variáveis aleatórias com densidade conjunta f. Derivaremos a seguir uma fórmula 
para a densidade da variável aleatória Z = Y/X. A figura 4 mostra o conjunto 


Az= {((х,у)1у/х <z} 
Se x < 0, então y/x <z se,e somente se, у > xz. Assim 


А, = ((x,p)Ix«0Oey2xz)U ((x,y)Ix > 0eyp&xz). 


Conseqüentemente 


^ 


|у, у) dx dy 


Fyjx(z) = 


A 


2 s ([ re. y) dy) dx + |, w f(x, у) dy) dx 


Figura 4 


Fazendo a mudança de variável у = xv (com dy = x dv) nas integrais internas 


obtemos 


Fyjx(z) = pai s xf (x, xv) do) dx 


+ | (E. xf(x, xv) do) dx 


ar js (E. (X XU) do) dx 


Invertendo a ordem de integração vemos que 


(21) Fy;x(z) = Г | [ x| f(x, xv) dx) do, — o < 


Segue-se de (21) que Y/X têm a densidade fy;y dada рог 


(22) fes = 


No caso especial em que X e Y são variáveis alestónum mdpendentes pos- 


tivas, (22) reduz-se a fyjy(z) = 0 pars т<0 e 
xfx(x) fyí xz) dx, D < 
0 


(23) Љх(2) = 


O teorema a seguir é uma aplicação direta de (23). 


E TE IxLfGx, xv) 2 dx. 


x| f(x, xz) dx, -æ < 


E (Г CET do) dx 


< 


8 


Teorema 3. Sejam X e Y variáveis aleatórias independentes com densi- 
dades gama Г(«,, А) e T(a,, А), respectivamente. Então Y/X tem a den- 
sidade dada por /уух(2) = 0 para 2<0 e 

Papa) 29: 


edis ТЫШ Je Lor Ou : 
(24) Љх(2) Tae) (2 + 1)"** nm 


Demonstração. Lembre-se que 


€41.,41771.—4x 
fx(x) = Luce = , E 0, 


Has) 


Agaysa- 19-2» 
ло) = б y > 0. 
à Г(а,) 


Pode-se aplicar (23), de modo que para 0< 2 < =, 


Atita oo м А 
хх“ te A(xgyma- 1g-àxz dx 


Im) 7 ro yr Jo 
Да +а2202—1 © 
= ы x 


— Г(о,)Г(аз) Jo 


21*42—165—xA(z t1) dx. 


De acordo com a Equação (34) do Capítulo 5 


|. хек схе у Re S Ia, + 05) _ 


0 É (A(z + D+ x 
Conseqüentemente a fórmula (24) é válida como foi afirmado. 
Uma vez que (24) define uma função de densidade, vemos que рага o4,05 > 0 


[ guot(z ЕВ ]) 61799 dz = T&M (a) б 
0 Ia, + а) 
Exemplo 6. Sejam Х е У variáveis aleatórias independentes, cada uma com 
densidade normal n(0, o? ). Obtenha a densidade de Y?/X?. 
As variáveis aleatórias são as mesmas do Exemplo 5. Assim X? e Y? são 
: novamente independentes e têm a densidade gama Г(1/2, 1/20?). O Teorema 3 
é então aplicável e Y?/X? têm a densidade fy2;y2 dada por fy: px2 (2) = 0 
para 2<0 e 
Г(1) ZEE 
I(1/21 (1/2) (2 + 1) 
- : 0 < 2 «lo. é 


л( + ру z 
(Lembramos da Equação (35) do Capítulo 5 que Г(1/2) = V п). A título de 
exercício deixamos para o leitor mostrar que, sob as mesmas condições, tanto Y/X 
como Y/|X| têm a densidade de Cauchy. 
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Fraxdz) = 


6.3. DENSIDADES CONDICIONAIS 


Para motivar a definição de densidades condicionais de variáveis aleatórias 
contínuas, discutiremos inicialmente as variáveis aleatórias discretas. Sejam X e Y 
duas variáveis aleatórias discretas tendo densidade conjunta f. Se x é um valor 
possível de X, então 

PB(X-x,Y-y) (х,у) 
} кер |ЖЖ еу SEX SIA 
arepe У 


A função /уух definida por 
MaD AN, 


(25) faxo 13) = LX) 
0, /х(х) = 0, 


chama-se densidade condicional de Y dado X. Para qualquer valor possível x de X, 


DICEN) E fx») -— 
AGO Мо) 
de modo que para qualquer x nestas condições fy;y(y/x) define uma função de 
densidade discreta de y, conhecida como densidade condicional de Y dado X =x. 
No caso discreto as densidades condicionais nào envolvem nenhum conceito novo. 
Entretanto se X é uma variável aleatória contínua, então P(X = x) = 0 
para todo x, de modo que P(Y = y/X = x) é sempre indefinido. Neste caso, 
qualquer definição de densidades condicionais envolve necessariamente um conceito 
novo. A maneira mais simples de definir densidades condicionais de variáveis alea- 
tórias contínuas é uma analogia com a Fórmula (25) do caso discreto. 


Y Sfr |x) = 


Definição 1. Sejam X e Y variáveis aleatórias contínuas tendo densidade 
conjunta f. Define-se a densidade condicional fy y através de 

f(x. y) 

(26) Л\х( у|х) = /х(%) і 


0, para outros valores de x e y. 


O < fx) < oo, 


Segue-se imediatamente desta definição que, como uma função de y, fy jy (у/х) 
é uma densidade sempre que 0 < fy(x) < o (novamente denominada densidade 
condicional de Y dado X = x). Pode-se utilizar as densidades condicionais para 
definir probabilidades condicionais. Assim definimos 


b 
(27) P(a = Y «5X - x = | уу! ду, а = Б. 


Alternaiivamente poderíamos tentar definir а probabilidade condicional 
de (27) através do seguinte limite: 


(28) С ЕЈР =х) 


= im Ras Y рх = АХ < х чыл). 
h10 
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L e n ms — ii 


CI RENE a cassia = лай. ИР алала ныннан É 


Pode-se reescrever o segundo membro de (28) em termos de f como 


lim dac (fi fu, у) dy) du E d лу e Уш. y) dy) du 


мо fan (Era AUi. у) dy) du hio (1/2h) 325 x(u) du 


x crib. 


Se 
"b 
| ш, y) dy 


é contínua em и para и = X, o numerador do ültimo limite converge para 
eb 


f(x, y) dy 


quando h 4 O. Se fy é contínua no ponto x, o denominador converge para 
fx(x) quando h | 0. Sob a condição adicional de que fy(x) 7 O, somos levados 
de(28)a 


Їх, у) dy 

Ix) 
que concorda com (27). Em resumo, definimos densidades condicionais e proba- 
bilidades condicionais no caso contínuo em analogia com o caso discreto. Obser- 
vamos também que, sob restrições adicionais, um processo envolvendo limites pro- 
duziria a mesma definição de probabilidades condicionais. Acontece que é bastante 
difícil trabalhar com tais processos, de modo que os mesmos não mais serão usados. 


Pla < Y <b|X = х) = 


Segue-se imediatamente da definição de funções de densidades condicionais que 
(29) fGx,y) = fxG)frixlx), —=<%у< =. 


Se X e Y são independentes e 


(30) fG,y)—-fxC)frO) —|——«x,y«e, 
então 
(31) fvix(y 1x) 2 fy), O«fxG)«o e -co<y<o, 


Reciprocamente, se (31) é verdadeiro, segue-se de (29) que (30) é verdadeiro e 
X e Y são independentes. Assim (31) é uma condição necessária e suficiente 
para que duas variáveis aleatórias tendo uma densidade conjunta sejam independentes. 
Exemplo 7. Suponha que X e Y têm a densidade bidimensional / dada pela 
Fórmula (13), ou seja 


/3 
(x, y) = 2 
/ ) 4л 


—(x2-xy ‚2 
Qe YA — 09 < х,у < со, 


Então, como vimos no Exemplo 2, X tem densidade normal n(0, 4/3). Assim рага 
OD Xs y < со 


v3 e (= -x*y+y?)/2 


E Е 


Er M е х/2)212, 

k \/2л 
Em outras palavras, a densidade condicional de Y dado X =x é a densidade 
normal n(x/2, 1). 

Até aqui partimos de densidades conjuntas e através delas construímos densi- 

dades marginais e densidades condicionais. Em certas situações podemos inverter 
este procedimento e começar com densidades marginais e densidades condicionais, 
usando-as para construir densidades conjuntas. 
Exemplo 8. Seja X uma variável aleatória uniformemente distribuída em (0, 1) 
e seja Y uma variável aleatória uniformemente distribuída em (0, X). Obtenha 
a densidade conjunta de X e Y e a densidade marginal de Y. 

Pelo enunciado do problema vemos que a densidade marginal de X é dada por 


para 0<х<1. 
fx0) = 


para outros valores de x 


A densidade de Y dado X =x é uniforme em (0, х), de modo que 


frixp12 | lx paa 0<у<х<1, 
para outros valores de x e y 


, 


A densidade conjunta de X e Y é dada por 


1/х аа sys 
fox. y) = as 2 


para outros valores de x e y 


A densidade marginal de Y é 
[ro] 1 
HO) = | f(x, y) dx = | ldx=logy, 0<y<1, 
— oo y 2 


e fy(y) = 0 para outros valores de y. 


6.3.1. REGRA DE BAYES. Naturalmente podemos inverter os papéis de X e Y 
e definir a densidade condicional de X dado Y — y através da fórmula 


(32) fnyGl5s A апе) « e. 


Uma vez que 
159 


ГО, у) = Оо) ху | x) 


ло) = | ло а = | одоо dx 


podemos reescrever (32) como 


OO) 


(33) faex |y) = fS fO fr Err 


Esta fórmula é o análogo contínuo da famosa regra de Bayes discutida no Capítulo 1. 
Nos Capítulos 3 e 4 consideramos variáveis aleatórias X e Y que eram 
ambas discretas. Até aqui no Capítulo 6 consideramos principalmente variáveis 
aleatórias X e Y que são ambas contínuas. Existem casos em qué estamos inte- 
ressados simultaneamente em variáveis aleatórias discretas e contínuas. Deve ficar 
claro para o leitor como podemos modificar nossa discussão para incluir esta possi- 
bilidade. Algumas das aplicações mais interessantes de (33) são deste tipo. 
Exemplo 9. Suponha que o número de acidentes automobilísticos em que se en- 
volve um motorista durante um ano é uma variável aleatória Y tendo uma distri- 
buição de Poisson de parámetro À, onde А depende do motorista. Se escolhemos 
um motorista ao acaso de uma certa população, podemos supor que А varia e define 
uma variável aleatória contínua A tendo uma densidade fA. A densidade condi- 
cional de Y dado A = А é uma densidade de Poisson de parámetro А dada por 


4 се dfe ОЛО 
12 = | е, 


у! 
lo, para outros valores de y 
Assim a densidade conjunta de A e Y é 


ANS 
LUE, LLLA para VENDA 09 


Jà, у) = | у! 
0, 


para outros valores de y 


Em geral náo podemos obter uma fórmula simples para a densidade marginal de 
Y ou a densidade condicional de A dado Y = y já que não podemos determinar 
as integrais necessárias. Entretanto podemos obter fórmulas simples no caso especial 
em que f é uma densidade gama T'(a, 8). de modo que 


parte 
ЛАО) = r(x) 


0, para outros valores de y. 


para A> 0 


Neste caso, 
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a” \ 


я) = [ лауа 


оо paja-1,-AB 9y,— À 
[EM Xe dà 


0 Г(«) M. 
= p* I Aet» lp A 1) аА 
y!I(a) Jo 
Г(а + y)p* 


TCB + DS 
O valor da última integral foi obtido usando a fórmula (34) do Capítulo 5. Dei- 
xamos para о leitor a título de exercício mostrar que fy é a densidade binomial, 
negativa de parámetros а e p = B/(1 + 8). Temos também que para A > 0 e 
y inteiro não-negativo, 
S30 

fy) 
= futt iu e уур gs nes 

Г(о)у!Г(а + y)p* 

(В i би ДУ ш ДЕ 1g-A(* 1) 

o FERA 


fajr | у) 


E) 


que nos diz que a densidade condicional de Л dado Y = y é a densidade gama 
Pa + y, 8 + 1). Se alguém de uma companhia de seguros desejasse resolver um 
problema deste tipo, possivelmente tentaria aproximar a densidade real f рага 
uma densidade Г(о, 8), onde а e f seriam determinados de modo que a apro- 
ximação fosse a melhor possível. 


6.4. PROPRIEDADES DE DISTRIBUIÇÕES MULTIDIMENSIONAIS 


Pode-se estender imediatamente para n variáveis aleatórias os conceitos até 
aqui discutidos em relação a duas variáveis aleatórias X e Y. Indicaremos breve- 
; mente nesta seção como isto pode ser feito. 

Sejam n variáveis aleatórias X,,...,X, definidas em um espaço comum 
de probabilidade. Define-se sua função de distribuição conjunta F através de 


(хс e xu yes PX A S Xy. uccide m Xp), =L Xi, ee Xn < оо, 
Definem-se as funções de distribuição marginal Fy,,, m = 1,...,n através de 


FxmXm)=P(Xm <хь), | —9 € xq <. 
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Pode-se obter o valor de Fym(Xm) a partir de F fazendo x,,...,Xm—1. 
Xm+1>---»Xn tenderem todos а +. 

Diz-se que uma função não-negativa f é uma função de densidade conjunta 
(em relação à integração) para a função de distribuição conjunta F, ou para as 
variáveis aleatórias X,,..., Xn se 


X1 f Xa 
(34) Flas с;з X3) = | UE | ftus и.) du, ``- du,, 
= «/ — 9 
—00 < à X, = 00 
Sob algumas condições brandas adicionais, a equação 
o” 
РО) = 2——— НЕ... Ж) 
0x "eg 


é válida nos pontos de continuidade de F. Se (34) for válido e A for um sub- 
conjunto qualquer de R” do tipo considerado em cálculo, então 


PX res AE) ps Гле dnd 
A 
Em particular 


(35) F a f(x, xdg, | 


ese am Sbm para m = 1,...,п, então 


Pla, < X, E po EM E) 


bi rb. 
| | Sis a de +++ dx, 


а Ја. 


A variável aleatória Xm tem densidade marginal fxm obtida pela integração 
de f sobre as n — 1 variáveis restantes. Por exemplo 


/х.(хә) = f is 1 fg З 17. ds ^ dx, 


Em geral diz-se que as variáveis aleatórias X,,..., X4 são independentes 
sempre que 4m Sbm, para m = 15:925 então 


P(a, < X, = by,... dp X Xn S by) 
—P(a.«X,«b).-.P(ay € X4 & by). 


Uma condição necessária e suficiente de independéncia é 


Fx, ...,Xg) = Ex, Qa) Pn) ESOS и: 
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A necessidade é óbvia, mas a parte da suficiência para п > 2 depende de artifícios 
peculiares e não será demonstrada aqui. Se F tem densidade f, então X,,..., Xn 
são independentes se, e somente se, pudermos escolher f de modo que 


f(x1,- Xn) 7 fx, e) t fn n). » uh Se TTE d 


Pode-se também definir diretamente uma densidade n-dimensional como 
uma função não-negativa em R” para a qual (35) é válido. A maneira mais simples 
de construir densidades n-dimensionais é a partir de n densidades unidimensionais 
fi... fa e definir f através de 


(36) Joc t х) s (cg) a 9): оу сохи S oo 


Se X,,..., Xn são variáveis aleatórias cuja densidade conjunta f é dada por 
(36), então X,,..., X, são independentes e Xm tem densidade marginal fm. 


Exemplo 10. Sejam X,,..., X, variáveis aleatórias independentes, cada uma 
com densidade exponencial de parâmetro А. . Obtenha a densidade conjunta de 
Х, з...) UN 

A densidade de X,, é dada por 


[де para” Ос С: бо, 


AX = 
fx, n) LO, para outros valores de x. 
Assim f é dada por 
f(x ies "wd TE ЕГОИСТ 
ел, 0, para outros valores de X1,...,Xn- 


Para determinar a densidade de somas de n variáveis aleatórias independentes, 
bem como para muitos outros propósitos, necessitamos do seguinte resultado. 


Teorema 4. Sejam n variáveis aleatórias independentes X,,..., Xn. Seja 
Y uma variável aleatória definida em termos de X,,...,Xm eseja Z шпа 
variável aleatória definida em termos de Xm+1....,Xn (coml<m<n) 


Então Y e Z são independentes. 

A demonstração deste teorema não será apresentada já que ela envolve argu- 
mentos da teoria da medida. 1 

Usando este teorema e um argumento envolvendo indução matemática, po- 
demos estender os Teoremas 1 e 2 para somas de п variáveis aleatórias indepen- 
dentes como segue. 

Teorema 5. Sejam X,,..., X, variáveis aleatórias independentes tais que 

Xm tem densidade gama T(a,,,A) para m = 1,...,n. Então X, *---* X, 

tem densidade gama T(a,A), onde а= o, *--- ta. 

Lembre-se que a densidade exponencial de parámetro А é a densidade gama 
Г(1, А). Assim, como um caso especial deste teorema, temos o seguinte corolário: 
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Se Xi, ..., Xn são variáveis aleatórias independentes, cada uma com densidede 
exponencial de parâmetro à, então X, +---+X, têm densidade goma Tin )) 
Teorema 6. Sejam X,, .. ., X, variáveis aleatórias independentes tes 
que Xm tem densidade normal n(um, 0h) m=1,....m Enão 
X,+---+Xy têm densidade normal n(o, о? ), onde 
U= Hi ttu e 0? = 03 +... +02. 4 


Se X,,..., Xn têm uma densidade conjunta f, então qualquer subcoleção 
destas variáveis aleatórias tem uma densidade conjunta que pode ser obtida inte- 
grando f sobre as variáveis restantes. Por exemplo, se 1 <m <и, 


... 
o 


Јах + ++ Xu) = | | TOS -a ахат ах À 


Pode-se também definir de maneira óbvia a densidade condicional de uma 
subcoleção de X,,..., Xn, dadas as variáveis restantes. Assim, a densidade con- 
dicional de Xm+1,...,Xn dados X,,..., Xm é definida por 

ао) 


РЕКЕ Е Хы Н+ Deco Xn | Xise. X) F , 


хыл CS, 


onde f é a densidade conjunta de X,,..., Xn. 

Frequentemente expressa-se as densidades condicionais através de uma notação 
um tanto diferente. Por exemplo, sejam n + 1 variáveis aleatórias com densidade 
conjunta f. Então a densidade condicional de Y dados X,,...,X, é definida por 


Vice, e) 
е) ; 
Pra XY | х; ) p РУ Жү 5. x) 
6.5 ESTATISTICOS DE ORDEM* 
Sejam U,,. .. , Оһ variáveis aleatórias contínuas independentes, cada uma 
com função de distribuição F e função de densidade f. Sejam X,,..., X, as 
variáveis aleatórias obtidas representando por X,(w), ..., Xn(w) o conjunto 
0, (о) ,... , Un(w) ordenado em ordem crescente. Em particular, X, e X, es 
são definidas como sendo as funções 
Ху (w) = min (U; (о),..., Un(w)) | 
e | 
SK 


Xn (w) = max (U; (w),..., Un (о)). 


A variável aleatória X; chama-se k-ésimo estatístico de ordem. Outra variável 
correlata de interesse é a amplitude R definida como 
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R(o) = X,(o) — Xi(o) 
= max (U,(0),..., U(0)) — min (U,(0),..., U(0)). 


Segue-se das hipóteses sobre Uj, .. . , Un que os U; são distintos com proba- 
bilidade 1 e portanto X, < X; «---« X4. | 
s Para ilustrar numericamente estas definições, suponha que U,(w) = 4,8; 
U, (w) = 3,5 e Us(w) = 4,3. Então Х, (о) = 3,5; Xa (w) = 4,3; Хз(о) = 4,8 
e R(w)= 1,3. 
Exemplo 11. Considere uma máquina tendo n componentes cujos tempos de 
falha satisfazem as hipóteses desta seção. Então X; é o tempo que decorre até 
p a falha de К componentes. Se a máquina como um todo falha tão logo que falhe 
E um único componente, então X, = min (U,,..., Un) é o tempo de falha da 
máquina. Se a máquina não falha até que todos os componentes falhem, então 
Xn = max (U,,..., U4) é o tempo de falha da máquina. 
Exemplo 12. Suponha que se produz n itens supostamente idênticos em uma 
corrida de uma linha de montagem e suponha que U,,..., Un representam os 
comprimentos dos n itens. Um inspetor poderia estar interessado no comprimento 
mínimo X, e no comprimento máximo X,. Se os itens devem ser intercambiáveis, 
a variabilidade dos comprimentos deve ser mantida baixa. Uma possível medida 
desta variabilidade é a amplitude R dos comprimentos. 
Passamos agora à obtenção da função de distribuição do k-ésimo estatístico 
de ordem Ху. Seja —o < х < o, A probabilidade de que exatamente j dos 
U; estejam em (—%,x] e (n – /) estejam em (х, ә) é 


(5) eoa - reo" 


uma vez que é aplicável a distribuição binomial de parámetros n e p = F(x). 
O evento (Xy < х} ocorre se, e somente se, k ou mais dos U; estiverem em 
(—99,x]. Assim 


(37) Fy(x) = Р(Х, < x) 


y (5 FIOI — FG), -0 «x < о. 


- j=k 


Em particular, pode-se escrever com muita simplicidade as funções de distribuição 
de X, e X, como 


Ехп(х) = (Е),  —vo<x<o, 


Fy,(x)-1—(l—FQ)) ex «on. 


Para obter as funções de densidade correspondentes, devemos diferenciar essas 
expressões. Obtemos facilmente que 
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RSS E A ^ 
fx,G) = nfG)F"- (0), —-=<х<=, 


fx,G)-nfG)1-FQ)"-', -9«x«e. 


A derivação correspondente para Xg em geral é um pouco mais trabalhosa. De (37), 


E n! jt p= k 
Jac) P GS fOF TG — FO) 
— bi cre AM fG)FA(x(1 — (хуу?! 
fife -j-— тт | 
= Ў i — f(x)Fi (х1 — FO) “| 
jg (0) — D! (п — j)! 


ы п! 


Ee fGOFi-(xX1 — FO) 
у=К+1 (j — 01 (п – j! | 


e por cancelação 
(38)  fx(X)- 


n ! 


= SOQFA — F(x)"*, 
(k — D! (n — Ю! 


— id isa o Шаш: Ei 


Para obter a densidade da amplitude К, derivamos inicialmente a densidade 
conjunta de X, e Xn. Supomos que n> 2 (já que К = 0 se n= 1). Seja x & y. 
Então 


Р(Х, »x, X, <у) = Р(х< 0, &y,...,x XU, &y) 
= (Е(у) – Р(х))", 


e naturalmente 
Р(Х, &y) = F” (y). 


Conseqüentemente } 


РОХ, у) 

Р(Х, < y – Р(Х, > x, X, < y) 
= Е"(у) — (FO) — Fœ)". | 

А densidade conjunta é dada por 


Fx, x, GG y) 


a2 
Гарса Реле е, | 
Ox ду | 


= n(n — DICISONFO) - F0, х=у.. 


ET и ый 


— 1 


É óbvio e demonstra-se facilmente que 


fx, хп0У)= 0, х>у. 


Modificando um pouco o argumento usado па Seção 6.2.1 para obter a densidade 
de uma soma, obtemos que a densidade de R = X, — X, é dada por 


frr) = E fx,x, Qo т + x) dx. 


Em outras palavras 


n(n — D | ГО) (н + xKXF(r + x) — FO)? dx, r»0 
fer) = "8 
0, Г 105 
Pode-se avaliar facilmente estas fórmulas quando U,,..., U, são independentes 


e se distribuem uniformemente em (0,1). Deixamos esta avaliação para o leitor 
a título de exercício. 

Existe uma forma “heurística” bastante útil para derivar as fórmulas acima. 
Como ilustração, derivaremos novamente a fórmula para fyg. Seja dx um número 
positivo pequeno. Então temos a aproximação 


fx4G) dx & P(x & Xy <x * dx). 


A maneira mais provável de ocorrer o evento { х < Xy <x + dx) é k 1 dos 
U; estarem em (—, x], um dos U; em (x,x+dx] e n — К dos Ui em 
(x + dx, œ) (ver Figura 5). A derivação da distribuição multinomial dada no Ca- 
pítulo 3 é aplicável e a probabilidade Че que o número indicado de U; esteja 
nos intervalos apropriados é 


n! 
fud ene n m c 


«(roe [n pma 


n! 


"Dig -2 Фер 1-Р) ТА, 


da qual obtemos (38). Não tentaremos dar rigor a este método. 
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6.6. DISTRIBUIÇÕES AMOSTRAIS* 


Sejam X,,..., X, variáveis aleatórias independentes, cada uma com densidade 
normal n(0, o°). Obteremos nesta seção as funções de distribuição de diversas 
variáveis aleatórias definidas em termos dos X. Além de se constituírem em 
aplicações do material acima, estas distribuições são de importância fundamental 
na inferência estatística e serão necessárias no Volume II. 

A constante 02. é conveniente mas não essencial, uma vez que X,/0,...,Xn/0 
são independentes e cada uma tem a densidade normal padrão n(0, 1). Assim 
podemos sempre tomar о? = 1 sem perda de generalidade. 

De acordo com o Teorema 6, a variável aleatória X, +... + X, tem a den- 
sidade normal de parámetros 0 е no?. Se dividirmos esta soma por diferentes 
constantes obtemos formas alternativas deste resultado. Assim 


distribui-se normalmente com parámetros 0 e 0?/n e 


X, teet X, 


ovn 


tem densidade normal padrão n(0, 1). 

Como X,/o tem a densidade normal padrão, segue-se do Exemplo 12 do 
Capítulo 5 que x7/0? tem a densidade gama Г(1/2, 1/2). Assim, de acordo com 
o Teorema 5 


X1t...tX2 
с? 
tem a densidade gama T(n/2, 1/2). Esta densidade рата particular é bastante 
importante em estatística, onde se diz que a variável aleatória correspondente tem 
distribuição qui-quadrada (x^) com n graus de liberdade que é representada por 
х? (n). Aplicando o Teorema 5 obtemos o seguinte resultado sobre as distribuições x. 


Teorema 7. Sejam Y,,...,Y, variáveis aleatórias independentes tais que 


Ym tem a distribuição x (km). Então Y, +... + Y, tem a distribuição 

X (k), onde к= К, +---+ kpn. 

Demonstração. Por hipótese Y,, tem a distribuição gama T(k/2, 1/2). 
Assim pelo Teorema 5, Y, +---+ Y, têm a distribuição gama T (k/2, 1/2), onde 
k=k, *-- t ks. Mas esta distribuição é x? (К) por definição. 

Podemos também aplicar o Teorema 3 para obter a distribuição da razão 
de duas variáveis aleatórias independentes Y,, e Y, tendo distribuição x? (k,) 


e x?(k,) respectivamente. É tradicional em estatística expressar os resultados 
em termos das variáveis normalizadas Y;/k, e Y?/k;. A distribuição de 


Yi/k, 
Y;/k; 


é conhecida como distribuição F com Kk, e К» graus de liberdade, sendo repre- 
sentada por F(k,, k32). 


Teorema 8. Sejam Y, e Y, variáveis aleatórias independentes tendo dis- 
tribuições x? (kı) e x? (К). Então a variável aleatória 


A 
Y;/k, 


que tem a distribuição F(k,, k2), tem densidade f dada por f(x) = 0 
para x «0 e 


(kilk) F[(k, + k5)/2] (a х/к) 71 


69) fen T(k,/2) F(kj/2) [1 + (k,x/k;) | +2 


x20. 


Demonstração. Pelo Teorema 3 a variável aleatória Y,/Y, tem densidade 
g, onde g é dada por (24) com о; = k,/2 e q = k,/2. Assim a densidade 
f de К„Ү,/К,Ү», é dada por 


e (39) segue-se de (24). 


Podemos aplicar este resultado às variáveis aleatórias X,,...,X, definidas no 
início desta seção. Suponha que 1 € m « n. Pelo Teorema 4 as variáveis aleatórias 


2 2 2 2 
Жү teact Xi e Amaai Fart Aa 


o? о? 


são independentes. Como elas têm distribuição х2 (т) е х2 (п — m) respectiva- 
mente, vemos que a variável aleatória 


(X1 +...+ X2,)m 
(Хм +1 toot XQ – m) 


tem a distribuição F(m, n — m) e a densidade dada por (39), onde К, =m e 
k = n — m. Tabelas das distribuições F são dadas no Volume II. 
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О caso т = 1 é especialmente importante. A variável aleatória 


Кын 2-2 
(X ++ XR- 1) 


tem distribuição F(1,n — 1). Podemos usar este fato para obter a distribuição de 


Xi 


C7 Vade XD 


Como X, tem uma função de densidade simétrica e é independente da variável 


aleatória V (X2. * ---* X2)/(n — 1). Segue-se facilmente do Teorema 2 do 


Capítulo 5 que Y tem uma funcáo de densidade simétrica fy. De acordo com o 
Exemplo 5 do Capítulo 5, a densidade fy, está relacionada com fy através de 


fr O = уут ЧҮС V2 + ЛУ), 2>0. 


Usando a simétrica de fy е fazendo 2 = у? vemos que 


fyo) = IyIfy: О?). 


Como Y? tem a densidade F(1,n — 1) dada por (39) com kı =1 e 
kı =k=n — 1, obtemos 


Ae DIOE DRE 
i T(1/2) Г(/2) [1 + o КОЗ 


Como Г(1/2) = « т, esta expressão se reduz a 


ТК дг 1)/2] (1 ib (Ую ld 


(40) ЛО) = los 
У kz T(k/2) 


— 0 < y < о. 


Diz-se que uma variável aleatória cuja densidade é dada por (40) tem distribuição 
t com k graus de liberdade. Observamos que a distribuição t com 1 grau de 
liberdade é a distribuição de Cauchy discutida no Capítulo 4. Tabelas das distri- 
buições £ são dadas no Volume II. 

A distribuição da variável aleatória 


Xi 


"VOS c ADD” 
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que é uma distribuição t com (n — 1) graus de liberdade depende apenas do 
fato de que 


Xi XS ot Yl 
Бы = Васы. 


o с 


são independentes e têm distribuição n(0, 1) e x? (и — 1), respectivamente. Assim 
temos o seguinte resultado. 
Teorema 9. Sejam X e Y variáveis aleatórias independentes com distri- 
buição n(0,1) e x? (X), respectivamente. Então 


Ж 


УҮК 


tem distribuição t com k graus de liberdade. 


6.7. MUDANCAS MULTIDIMENSIONAIS DE VARIÁVEIS* 


Sejam X,,...,X, variáveis aleatórias tendo densidade conjunta f. Sejam 
Y,,...,Y, variáveis aleatórias definidas em termos de X. Nesta seção discu- 
tiremos um método para obter a densidade conjunta dos Y em termos de f. 
Consideraremos principalmente o caso em que se definem os Y como funções 
lineares de X. 


Suponha então que 


n 
Y, = У ak, [ж Йй ый: 


у= 
j=1 


Os coeficientes constantes 2;; determinam uma matriz n x n 


1 ... ain 
А = [aij] ms : сй ES 
а, Ер Ann 


Associada a esta matriz está o seu determinante 


ayp 1и 
СЕИ : 
аһ\ "cm Ann 


Se det А — 0, existe uma única matriz inversa B = [ b;j ] tal que BA =I ou 
equivalentemente 


n 3 
(41 ! b. dr = E 8 ` 
a uno itj 


T71 


Pode-se obter as constantes bj; resolvendo para cada i o sistema (41) de n equa- 
ções а n incógnitas bjj»... bin: Alternativamente, as constantes bj; podem 
ser unicamente definidas exigindo que as equações 


tenham soluções 


n i 
(42) Ху = ` ЬУ)» = P 
j=1 
Teorema 10. Sejam X,,...,X, variáveis aleatórias tendo densidade conjunta 
f e suponha que as variáveis aleatórias Y,,...,Y, são definidas por 
n | 
fe а Р= lost 
je ' 
onde a matriz А = [ ар; ] tem determinante não-nulo det 4. Então 
Y,,...,Y, tém а densidade conjunta fy,.....fy, dada por 
1 
43 Juniores Paco ox 
bia MES TEE X 
onde os x são definidos em termos de y por (42) ou como a solução 
única das equações y; = 25-1 4;jXj. 
Este teorema, que não será demonstrado aqui, é equivalente ao teorema de- 
monstrado em cursos avangados de cálculo em um contexto mais geral envolvendo 
"Jacobianos". Do resultado geral demonstrado em cálculo avançado, podemos 
estender o teorema acima a mudanças não-lineares de variáveis. Descreveremos 
brevemente esta extensão, embora ela não seja necessária mais tarde. 
Suponha que os Y são definidos em termos de X por 
Y; ap Xa caça Xn) к=. п 
Considere as equações correspondentes 
(44) Ур gere An), EL sds 
Suponha que estas equações definem unicamente os x em termos de y, que as : 
derivadas parciais ду ;/дх; existem е são contínuas е que o Jacobiano 
EM eor 
0X4 0х, | 
а : | j 
у. OP 
дх, дх, 
é sempre não-nulo. Então as variáveis aleatórias Ү,,..., Y, são contínuas е 


têm uma densidade conjunta dada por 
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сыңгы сы. 0 JN 
(xs... xyJI 


(45) in nU. -- > Pa) Sises Xa), 

onde os x são definidos implicitamente em termos de y por (44). Pode-se 
estender ainda mais esta fórmula de mudança de variável, exigindo que as funções 
g; sejam definidas, apenas em algum subconjunto aberto S de R” tal que 


1 PIO, «XE 1 
No caso especial em que y; = У5-1 aix; vemos que ðy;/ðxj = ajj e 
J(xi....X&4) é simplesmente a constante det А = det | а |. Assim, torna-se 
claro que (45) se reduz a (43) no caso linear. 

) Exemplo 13. Sejam X,,..., X, variáveis aleatórias independentes, cada 

| uma com densidade exponencial de parâmetro A. Defina Y,;,...,Y, рог 
Y;=X, +---+ Xj I &i sn. Obtenha a densidade conjunta de Y,,...,Y,. 


A matriz [a;;] é 


Seu determinante é claramente 1. As equações 

Y=X t-t Xj Do sectis 
têm a solução 

^t = у» 


хі = у= уі-1, {= 2,...,1. 


А densidade conjunta de X,,...,X, é dada por 
any Alr t * +хю) * 
(46) 7 RP н ) e [Ae A Dons eas Ха, 
; (0, para outros valores de x,,...,Xy 
| Assim a densidade conjunta fy,,,.., y, é dada por 
Р * ; pru ew, 0 < Vip SS SS 
(47) inc xU ++ Dal = LO, para outros valores de y4,..., y, 
Naturalmente podemos aplicar o teorema em sentido inverso. Assim se 
1 Y,;....,Y, têm a densidade conjunta dada por (47), e as variáveis aleatórias 
Adi e X, são definidas por X, = Y, e X; = Yj — Yj: , para 2<i<Sn, 
então os X têm a densidade conjunta dada por (46). Em outras palavras, 
Silo d X, são independentes, cada uma com distribuição exponencial de parâ- 


metro А. Usaremos este resultado no Capítulo 9 na discussão de processos de Poisson. 
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Exercícios 


1. Sejam X e Y variáveis aleatórias contínuas tendo função de densidade con- 
junta f. Obtenha a função de distribuição conjunta e a função de densidade 
conjunta das variáveis aleatórias W = a + bX e Z = c + dY, onde b>0 
e d > 0. Mostre que se X e Y são independentes, então W e 7 são inde- 
pendentes. 


2. Sejam X e Y variáveis aleatórias contínuas tendo função de distribuição 
conjunta F e função de densidade conjunta f. Obtenha a função de distri- 
buição conjunta e a função de densidade conjunta das variáveis aleatórias 
W= X? e Z= У? Mostre que se X e Y são independentes, então W e Z 
são independentes. 


3. Sejam X e Y variáveis aleatórias independentes, cada uma com distribuição 
uniforme em (0,1). Obtenha 


(а) PIA Уре 0,5). 
B 
(b) (| Х IE 


(с) P(Y2 X|Y2 1/2). 


4. Sejam X e Y variáveis aleatórias independentes, cada uma com distribuição 
normal п(0, 02). Obtenha Р(Х? + Y? < 1). Sugestão: usar coordenadas 
polares. | 

5. Suponha que X e Y tém uma densidade conjunta f uniforme no interior do 
triángulo com vértices em (0, 0), (2, 0) e (1, 2). Obtenha Р(Х<1 e Y & 1). 

6. Suponha que os tempos que dois estudantes levam para resolver um problema 
são independentes e se distribuem exponencialmente com parámetro А. Deter- 
mine a probabilidade de que o primeiro estudante necessite pelo menos do 
dobro do tempo gasto pelo segundo estudante para resolver o problema. 

7. Sejam X e Y variáveis aleatórias contínuas tendo função de densidade con- 
junta dada por f(x, y) = Ne X, 0 & x € y, e f(x, y) = 0 para outros 
valores de x e y. Obtenha as densidades marginais de X e Y. Obtenha a 
função de distribuição conjunta de X e Y. 

8. Seja flx,y)=c(y-x)*, 0<х<у< 1, e f(x, y) = 0 para outros valores 
de x e y. | 
(a) Para que valores de o se pode escolher c para fazer de f uma função 

de densidade? 
(b) Como se deve escolher c (quando possível) para fazer de f uma densidade”? 
(c) Obtenha as densidades marginais de f. 

9. Seja f(x, y) = ce- (8° -xy *4»y*)/2. oo < x, y <œ, Como se deve escolher 

c para fazer de f uma densidade? Obtenha as densidades marginais de f. 


10. Sejam X e Y variáveis aleatórias contínuas independentes tendo densidade 
conjunta f. Derive uma fórmula para a densidade de Z — Y — X. 

11. Sejam X e Y variáveis aleatórias contínuas independentes tendo as densidades 
marginais especificadas abaixo. Obtenha a densidade de Z — X * Y. 
(a) X e Y distribuem-se exponencialmente com parâmetros А, e àz, onde 

À Edo. 

(b) X é uniforme em (0,1) e Y distribui-se exponencialmente com parâmetro А. 

12. Suponha que X e Y tém a densidade conjunta f dada no Exercício 8. 
Obtenha a densidade de Z — X * Y. 

13. Suponha que X e Y são independentes e distribuem-se uniformemente em 
(a, b). Obtenha a densidade de Z = | Y — X|. 

14. Sejam X e Y variáveis aleatórias contínuas tendo densidade conjunta f. 
Derive a fórmula para a densidade de 2 = aX + БҮ, onde b +0. 

15. Seja f uma densidade Beta de parámetros o; > 1 e o, > 1. Em que ponto 
f assume o seu valor máximo? 


16. Sejam А e Y vanáveis aleatórias independentes, tendo as densidades normais 


n(u,.07) e n(u5, 02), respectivamente. Obtenha:a densidade de Z = Y — X. 
17. Suponhs que se escolhe aleatoriamente um ponto no plano de tal forma que 
suas coordenadas se distribuem independentemente segundo a densidade normal 
п(0. с? ). Obtenha a função de densidade da variável aleatória R que representa 


a distância do ponto escolhido à origem. (Esta densidade ocorre em engenharia 
elétrica, sendo conhecida como densidade de Rayleigh). 

18. Sejam X e Y variáveis aleatórias contínuas tendo densidade conjunta f. 
Derive a fórmula para a densidade de Z = XY. 


19. Sejam X е Y variáveis aleatórias independentes, cada uma com a densidade 


normal т(0. о?). Mostre que tanto Y/X como Y/|X| têm a densidade 
de Cauchy 
20. Sejam X e Y definidos como no Exercício 19. Obtenha a densidade de 
= үй! 


21. Sejam X e Y duas variáveis aleatórias independentes, cada uma com distri- 
| buição exponencial de parâmetro А. Obtenha a densidade de Z = Y/X. 
22. Sejam X e Y duas variáveis aleatórias independentes tendo as densidades 
gama L(o;, А) е Г\(о,, №), respectivamente. Obtenha a densidade de 
Z = X/(X + Y). Sugestão: expresse Z em térmos de Y/X. 


i 23. Suponha que X e Y tém a densidade conjunta f indicada abaixo. Obtenha 
a densidade condicional f yix em cada caso. 


(a) f como no Exercício 7, 
(b) f como no Exercício 8, 
(c) f como no Exercício 9. 
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27. 


29: 


30. 


ЭЛ. 


33. 
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. Suponha que X e Y se distribuem como as variáveis definidas no Exemplo 7. 
Determine P(Y «2| X = 1). 
. Mostre que a densidade marginal fy no Exemplo 9 é binomial negativa com 
parâmetros a e p = f/(8 + 1). Sugestão: use a fórmula (36) do Capítulo 5. 
. Seja Y uma variável aleatória discreta tendo a distribuição binomial de pará- 
metros п e p. Suponha que p se comporta como uma variável aleatória 7 
tendo a densidade Beta de parâmetros о; e аз. Obtenha a densidade condi- 
cional de л, dado Y — y. 
Suponha que Y se distribui exponencialmente com parâmetro A. Suponha 
que А se comporta como uma variável aleatória A tendo a densidade gama 
Г(о, 8). Obtenha a densidade marginal de Y е a densidade condicional de 
A dado Y = y. 


. Suponha que X,, X,, e Хз representam os componentes da velocidade 


de uma molécula de gás. Suponha que X,, X, e X; são independentes, 
cada uma com densidade normal n(0, o°). Diz-se em física que a magnitude 
da velocidade Y = (X2 + X2 + X$)^ tem uma distribuição de Maxwell. 
Obtenha fy. 

Sejam X,,..., X, variáveis aleatórias independentes tendo uma densidade 
normal comum. Mostre que existem constantes 4, e B, tais que 


Жү =з Xn — An 
Bn 


têm a mesma densidade de X e 

Sejam X,, X; e Хз variáveis aleatórias independentes, individualmente 
uniformes em (0,1). Obtenha a densidade da variável aleatória Y = X, + X, + X3. 
Determine Р(Х, +X, + X4 <2). 

Suponha que se escolhe X, uniformemente em (0, 1), X, uniformemente 
em (0, X,) e que se escolhe X4 uniformemente em (0, X,). Obtenha a 
densidade conjunta de X,, X; e Хз ea densidade marginal de Хз. 


. Sejam U, ..., U, variáveis aleatórias independentes, cada uma com distri- 
buição uniforme em (0, 1). Sejam Xp. k=1,...,n, e R definidos como 
na Seção 6.5. 


(a) Obtenha a densidade conjunta de X, e X,. 

(b) Obtenha a densidade de R. 

(c) Obtenha a densidade de Xp. 

Sejam U,,... , Оһ variáveis aleatórias independentes, cada uma com 
densidade exponencial de parâmetro A. Obtenha a densidade de X, = min 
(Оу eras Um): 

. Obtenha uma fórmula para a densidade x? (n). 


35. Sejam X e Y variáveis aleatórias independentes tendo as densidades x? (т) 
e x? (п). respectivamente. Obtenha a densidade de Z = X/(X + Y). Sugestão: 
use a resposta do Exercício 22. 

36. Sejam X e Y variáveis aleatórias independentes, cada uma com a densidade 
normal padrão. Obtenha a densidade conjunta de aX + bX e БХ —aY, onde 
а? + b! > 0. Use este resultado para dar uma outra demonstração ao 
Teorema 2. 

37. Sejam X е Y variáveis aleatórias independentes com densidade comum f. 
Obtenha a densidade conjunta de X e Z = X + Y. 

38. Sejam X е Y variáveis aleatórias independentes, cada uma com a densidade 
exponencial de parâmetro А. Determine a densidade condicional de X dado 
Z=X+Y=z Sugestão: use o resultado do Exercício 37. 

39. Resolva o Exercício 38 para o caso em que X e Y se distribuam uniforme- 
mente em (0, c ). 

40. Suponha que U е V são variáveis aleatórias independentes, cada uma com 
densidade normal padrão. Seja Z = pU + V 1 — р? V, onde —1<р <1. 
(a) Obtenha a densidade de Z. 

(b) Obtenha a densidade conjunta de U e 7. 

(c) Obtenha a densidade conjunta de X = u, + o1U e Y = m, * 05Z, onde 
с, > 0 e в, > 0. Esta densidade é conhecida como densidade normal 

(d) Obtenha а densidade condicional de Y dado X = x. 

41. Sejam X = Y variáveis aleatórias contínuas positivas com uma densidade 
conjunta f. Sejam W = Y/X е Z = X + Y. Obtenha a densidade conjunta 
de W e 7 em termos de f. Sugestão: use a Equação (45). 

42. Sejam X е Y variáveis aleatórias independentes tendo as densidades gama 
Г(е,, А) e Tez, А), respectivamente. Use o Exercício 41 para mostrar 
que Ү/Х e X+Y são variáveis aleatórias independentes. 

43. Sejam R e O variáveis aleatórias independentes tais que R tem a densidade 
de Rayleigh 


A IV 


rz. 
ro. 
e Ө se distribui uniformemente em (—7z, п). Mostre que X =R соѕ Ө e 


Y = К sen Ө são variáveis aleatórias independentes e que cada uma tem a 
densidade normal n(0,0?). Sugestão: use a equação (45). 


Ka 
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EXPECTANCIAS E O 
TEOREMA DO LIMITE CENTRAL 


Nas primeiras quatro seções deste capítulo estudamos a definição e propriedades 
das expectâncias de variáveis aleatórias que não são necessariamente discretas. 
Na Seção 7.5. discutimos o Teorema do Limite Central. Este teorema, um dos mais 
importantes na teoria da probabilidade, justifica a aproximação de muitas funções 
de distribuição pela função normal apropriada. 


7.1. EXPECTÂNCIAS DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS 


Lembremos a definição e expectância de uma variável aleatória discreta 
X de densidade f (Capítulo 4). Dizemos que X tem expectância finita se 
Ex |x | f(x) € =, e neste caso definimos sua expectância EX, como 


ЕХ = У хў(х). 


A maneira mais fácil de definir expectâncias de variáveis aleatórias contínuas que 
possuem densidades é em analogia com o caso discreto. 


Definição 1. Seja X uma variável aleatória contínua de densidade f. Dizemos 
que X tem expectância finita se 


P xi f (x)yrdx « ©, 


- 0C 


e neste caso definimos sua expectáncia por meio de 
EX = | aa) ах. 


Usando esta definição, podemos calcular facilmente as expectâncias de variáveis 
aleatórias contínuas tendo as diversas densidades discutidas nos Capítulos 5 e 6. 


P 


Exemplo 1. Suponha que X se distribui uniformemente em (a, b). Então 


b 21b 
Ех = | ( аав = 
а b—a b — aj 21a 2 


Exemplo 2. Suponha que X tem a densidade рата T'(a, À). Então 


oo a 
ex = | EE Eu lo Ad 


Г(ә) at 1 


[04 


3 


À 


onde usamos as fórmulas (34) e (36) do Capítulo 5. Fazendo а = 1 vemos que 
se X tem uma densidade exponencial de parâmetro А, então EX = A^. 


Exemplo 3. Suponha que X tem a densidade de Cauchy f dada por 


= UR — оо oo 
fol «x « eo, 


Então X não tem expectância finita, pois 


| |х| —" :| E dk 
- 0 л(1 + x?) To 1 x? 


D Ee | E 393 
T co ЛЛ 


| lim log (1 + x?) 
0 


T co 


I 
| 
d 


Il 


oo. 


72. UMA DEFINIÇÃO GERAL DE EXPECTÂNCIA 


A definição de expectância dada na Seção 7.1 é certamente apropriada do 
ponto de vista computacional para o caso de variáveis aleatórias contínuas que 
possuem densidades. Entretanto, para definir expectância em geral é melhor es- 
tender a noção de expectância diretamente do caso discreto ao caso geral. Os de- 
talhes precisos requerem conhecimentos adicionais da teoria da medida e integração. 
Vamos supor em nossa discussão que todas as variáveis aleatórias em consideração 
são definidas em um espaço fixo de probabilidade (Q, 2, P). 

Sejam X e Y variáveis aleatórias discretas tais que P(|X — Y| e) = 1 
para algum € > 0. Segue-se dos Teoremas 2 (iii) e 3 do Capítulo 4 que se Y tem 
expectáncia finita, X também a tem e | EX — EY | < e. Segue-se também que 
se Y não tem expectância finita, X também não tem. Quando se define expec- 
tância em geral, estas propriedades devem continuar sendo válidas. 


4y 


> 


Suponhamos que este é o caso e seja X uma variável aleatória qualquer. 
Suponha que desejamos calcular EX com erro não superior a e, para algum e>0. 
Tudo que precisamos fazer é obter uma variável aleatória discreta Y tal que 
P(|X — Y|<e)=1 e determinar EY de acordo com os métodos do Capítulo 4. 

É fácil obter tais aproximações para X. Seja X, a variável aleatória discreta. 
definida por 


(1) Xe=ek se eX<X<e(k+1) para k inteiro. 


Pode-se também definir esta variável aleatória em termos da função de maior inteiro 
[ ] como X.=e[X/e]. Se e= 107" para algum inteiro não-negativo п, X, (c) 
pode ser obtido de X(%w) escrevendo X(w) em forma decimal e desprezando 
todos os dígitos que estiverem a n ou mais casas além do ponto decimal. Segue-se 
imediatamente de (1) que 


X(w) ce<X (o) € Х(о), WE ©, 


e portanto P(|.X — X. | <e)=1. A função de densidade de X, é dada por 


Жыр = P(sk < X < &k + 1)) se x — ek para К inteiro 
xo) = 0 para outros valores de x. 


A variável aleatória X, tem expectância finita se e somente se 
У Ixlfx, G9) = У leklP(ek < X < e(k + 1) < oo, 
x k 


neste caso 


ЕХ, = Y ckP(ck < X < ek + 1). 


ý k 
Pode-se escrever estas expressões em termos de F y. Para 
P(ek<X<e(k+1))=P(X<e(k+1))-P(X<ek) 


e pela Equação (5) do Capítulo 5, P(X < x) = Р(х —) se verifica para todo x. 
O teorema seguinte, que enunciamos sem demonstrar, será usado para dar uma 
definição geral de expectância. 


Teorema 1. Seja X uma variável aleatória e suponha que Х;, є2 0, seja de- 


finido por (1). Se X, tem expectância finita para algum € 0, então X, 
tem expectância finita para todo e>0 e 


lim EX, 
E—> 00 
existe e é finito. 
Este teorema e a nossa discussão precedente sugerem a seguinte definção geral 
de expectância. 
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Definição 2. Seja X uma variável aleatória e suponha que Х,, є 2 0, seja 
definido por (1). Se X, tem expectância finita para algum є > 0, dizemos que 
X tem expectância finita e definimos sua expectância EX através de 

ЕХ = lin ЕХ 


£0 
No caso contrário dizemos que X não tem expectância finita. 


Da discussão que precede o Teorema 1 segue-se que a definição de EX pode 
ser dada em termos da função de distribuição de X e que se duas variáveis aleatórias 
têm a mesma função de distribuição, suas expectâncias são iguais (ou ambas não 
são finitas). Usando técnicas da teoria da medida e integração, pode-se mostrar 
que a Definição 2 conduz aos mesmos valores que as definições anteriores para os 4 
casos em que X é discreto ou quando X é uma variável aleatória contínua que 
possui uma densidade. Existe um análogo do Teorema 1 do Capítulo 4 que enun- 
ciamos sem demonstração. Neste teorema, p pode ser qualquer função do tipo 
considerado em cálculo. 


SE 


Teorema 2. Sejam X,,..., Xn variáveis aleatórias contínuas tendo den- 
sidade conjunta f e seja Z uma variável aleatória definida em termos de 
X,,...,Xq através de Z=y(X,,...,Xn). Então Z tem expectância finita 


se e somente se 
oo oo | 
INE ое a ч =» 
— о — 0 
e neste caso ) | 
oo oo 
Ez = | =ч] (X1. X Жз a а dx. 


Podemos mostrar que as propriedades básicas da expectància demonstradas 
no Capítulo 4 para variáveis aleatórias discretas são válidas em geral. Em parti- 
cular os Teoremas 2,3 e 4 do Capítulo 4 são válidos e serão usados livremente. 

Como no caso discreto, nos referimos, às vezes, a EX como média de X. 
As definições de momentos, momento central, variância, desvio padrão, covariância 
e correlação dadas no Capítulo 4 para variáveis aleatórias discretas dependem so- | 
mente da noção de expectância e estendem-se imediatamente para o caso geral. T 

Em geral, como no caso discreto, se X tem um momento de ordem r, então À 
X tem um momento de ordem k para todo k <r. Os Teoremas 6 e 7 do Ca- | 
pítulo 4 são também válidos em geral. O leitor deve rever os teoremas e definições 
mencionadas no Capítulo 4 antes de prosseguir para a seção seguinte. 


7.3. MOMENTOS DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS 


Seja X uma variável aleatória contínua tendo densidade f e média и. Se 
X tem um m-ésimo momento finito, então pelo Teorema 2 
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E(X — u” = | (x — ufo) ах. 


Em particular, se X tem segundo momento finito, sua variância 0? é dada por 
© 
в? = | (х — и)?/(х) ах. 
© 


Observe que о? > 0. Pois se o? = 0, teríamos pelo argumento da Seção 4.3 que 
Р(Х = и) = 1, o que contradiz a hipótese de que X é uma variável aleatória 
contínua. 
Exemplo 4. Suponha que X tem a densidade gama Г(а, À). Obtenha os mo- 
mentos e a variância de X. 

O m-ésimo momento de X é dado por 


ЕХ" = | х" a Ж е td 
0 Г(о) 
= À xmnt*a-ig-àx dx, 
I(x) Jo 


de modo que pelas fórmulas (34) e (36). do Capítulo 5 


(2) Ех" = “Tm + o) 
Аро) 
= © + Deu m 1) 
un ` 


A variância de X é dada por 


2 
a(a + 1 а а 
С ВХ (ЕХ) dd -(8) =: 


Fazendo а = 1, vemos que se X tem densidade exponencial de parâmetro A, 
então ЕХ" = m! \-" e X tem variância A—?. Como um segundo caso especial, 
suponha que X tem a distribuição x? (п) que, de acordo com a Seção 6.6, é а 
distribuição Г(и/2, 1/2). Então 
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Frequentemente podemos tirar partido da simetria na determinação de mo- 
mentos. Por exemplo, se X tem densidade simétrica, se ЕЛ?" existe e se m 
é um número inteiro positivo ímpar, então EX?" = 0. Para verificar este resultado, 
observe que pelo Teorema 2 do Capítulo 5, X e —X têm a mesma função 
de distribuição. Assim .X" е (—X)" = —Хт tem a mesma função de dis- 
tribuição e consequentemente a mesma ехресійпсіа. Em outras palavras 
ЕХ" = E(— X") = — EX", o que implica em ЕХ" = 0. 

Exemplo 5. Suponha que X tem a densidade normal п(и, o?). Obtenha a média 
e os momentos centrais de X. 


A variável aleatória X — и tem a densidade normal n(0,0?), que é simétrica. 
Assim E(X — и)" = 0 para todo número inteiro positivo ímpar т. Em particular 
E(X — и) = 0, o que mostra que o parámetro u da densidade normal n(u, o? ) 
é simplesmente a média da densidade. Segue-se então que todos os momentos 
centrais de ordem ímpar de X são iguais a zero. Para determinar os momentos 
centrais de ordem par, lembramos da Seção 5.3.3 que Y — (X — и)? tem a den- 
sidade gama T'(1/2, 1/20?). Como E(X — ци)" = ЕҮ"/?, para m par, segue-se 
do Exemplo 4 que 

Г (25) 
2 


p 


E(X — u)” 


e ® у 

1 \т/2 

бы) 
ges e (т = e 

Usando as fórmulas (35) e (38) do Capítulo 5, obtemos a fórmula alternativa 


m! 
2m/2 (2): 
2) 


Em particular o? representa as variâncias de X e E(X — u} =3о°. 


m 


(3) E(X — p)" = 


Sejam X e Y variáveis aleatórias contínuas tendo densidade conjunta f, 
médias uy e uy, е segundos momentos finitos. Sua covariância é dada por 


O BX- uY- m= | | E- my nofes 9 ax dy. 


Exemplo 6. Suponha que X e Y têm a densidade conjunta f do Exemplo 2 
do Capítulo 6. Obtenha a correlação entre X e Y. De acordo com o Exemplo 2 
do Capítulo 6. 


ar 


E qm a 


з». са эсш 


УЗ „-ц[о2-ху+угулз] 


4л 


Ha, у) 


v3 e 9? I8g-l0-x/29/2] 

4n 

Vimos naquele exemplo que tanto X como Y têm a densidade normal п(0, 4/3). 
Assim uy — рү = 0 e Var X = Var Y = 4/3. Da Equação (4) e da segunda ex- 
pressão de f temos 


V3 (* ass 2 yl. tony 
EXY = | xe (3:18) dx у —= 71-12721 dy, 


2/2n V27 
Mas 
E y 1 e-lo-s29/2 dy = [ (x + j EN LT TN 
ERAS QE E 2 
de modo que 


HE e се) | хе AVE ga 
2 ( : ) Jm O 
y = л 
МЕ 


12 | х?п(х; 0, 4/3) dx 


1/2:4/3 = 2/3. 
A correlação p entre X e Y é dada por 


o UL REN a igh = ig 
W Var X VVar Y V4/3 4/3 29 
Exemplo 7. Sejam U,,...,U, variáveis aleatórias independentes, cada uma 


com distribuição uniforme em (0, 1) e seja 


X —min(U, Up) 


Y = max (U,, ... , U,). 


Obtenha os momentos de X e Y ea correlação entre X e Y. | 
Estas variáveis aleatórias foram estudadas na Seção 6.5 (onde foram repre- 
sentadas por X, e Xn). Especializando os resultados daquela seção para U; 
que se distribuem uniformemente, concluimos que X e Y têm a densidade con- 
junta f dada por 
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_ Гап – 10у – х)" 7°, O0Oxzxszysi 
(5) foy 0, outros valores de x e y. 


Os leitores que omitiram a Seção 6.5 podem pensar no presente problema como 
o de obter a correlação entre as variáveis aleatórias X e Y cuja densidade conjunta 


é dada por (5). 
O m-ésimo momento de X é dado por 


n(n — 1) | x" dx [ (y = xy? dy 


1 um п-1|у=1 
n(n — 1) | A dk Баи 
0 п— 1 


ЕХ" 


у=х 


Il 


1 
n f "(1 = x)" dx. 
0 


A integral definida que aparece nesta expressão é uma integral Beta e foi determi- 
nada na fórmula (19) do Capítulo 6. Daquela fórmula obtemos 
Un! 
ЕХ" = пГ(т + Dr(a) Lou 
Г(т+п+1) (m+n)! 


Em particular EX = 1/(n + 1) e EX? = 2[(n + 1)(n + 2). Segue-se que 
n 


— 2 == 
Var (ЕХ?) - (EX! = c ia) 


O m-ésimo momento de Y é dado por 


E = 
EY" = n(n — 1) | у" ду | (y — ху? dx 
Jo Jo 


GF xp 


п — 1 х=0 


fi 
n(n — 1) | у" dy 
Јо 


- [ау 
JO 


mcn 
Assim EY = n/(n * 1) e 
2 
Var Y = —— – (=) =. 
п+ 2 nal (п D'(n + 2) 
Alternativamente, estes resultados podem ser obtidos das densidades marginais 


de X ex. 
Para obter a covariância de X e Y começamos com 
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q mim —  —— 


: : 
EXY =-n(n — » | »4 | x(y — xy? dx. 
0 0 


Como 
х(у –х)"-2 = у(у – х)"-2 – (у – х)"-1, 
“obtemos 
EXY = nn = 1) | dy [у-у 2 dx 
1 
= = Д у ay |, (y = xy"! dx 
0 o 
1 E n-l(. 1Y|x-y 
= n(n — 1) | у? jb 1) 
Jo п — 1 х=0 
As n(n кы р |, у dy - (у= ax E XU 
x-0 
1 
= nf yum dy € (n E D || у dy 
0 0 ? 
A E 
n+2 
Conseqüentemente 
Cov (X; Y) = ЕХУ — EXEY 
1 п. 


"I (n + 1)? 
= DC ГЇ — dá 
mDr 
Finalmente obtemos para a correlação entre X e Y 
Cov (X, Y) 


Bu X Var Y 


1 n 
(n + Dn + $i (n + Dn + 2) 
1 
"E 


7.4. EXPECTÂNCIA CONDICIONAL 


Sejam X e Y variáveis contínuas tendo densidade conjunta f e suponha 
que Y tem expectância finita. Na Seção 6.3 definimos a densidade condicional 
de Y dado X =x através de 
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Fa, у) 
ЛлхО 1x) = | у(х), 


0, para outros valores de x e y. 


O « fy(x) < oo, 


A função fy,y(y 1х), —°° < y < o, é uma função de densidade para cada x 
tal que 0 < fy(x) < o de acordo com a Definição 5 do Capítulo 5. Assim po- 
demos pensar em vários momentos desta densidade. A sua média chama-se expec- 
tância condicional de Y dado X=x, sendo representada por 


Е[Ү|Х=х] ou E[Y |x ]. Assim 


© 


© OHYix-xp-[ 019 


_ SE yf, у) dy 
Р(х) 
quando 0 < fy (x) < =. Para outros valores definimos Ё[ Y | X = x ] = 0. A função 
definida por m(x) = E[Y|X =x] chama-se em estatística função de regressão 
de Y sobre X. 

Como veremos no Volume II, as expectâncias condicionais ocorrem em pro- 
blemas estatísticos que envolvem predição e estimação bayesianas. De um ponto 
de vista mais geral, elas são também importantes na teoria avançada de probabilidade. 
Nos limitaremos a algumas aplicações elementares de expectâncias condicionais. 
A teoria geral é bastante sofisticada e não será requerida neste livro. 

Exemplo 8. Suponha que X e Y têm a densidade conjunta do Exemplo 2 do 
Capítulo 6. Obtenha a expectância condicional de Y dado X =x. 

No Exemplo 7 do Capítulo 6 vimos que a densidade condicional de Y dado 

X —x éa densidade normal n(x/2,1) que sabemos ter média x/2. Assim 


Е[Ү|Х=х] =. 


Neste exemplo a variância condicional de Y dado X =x ё а constante 1. 
Exemplo 9. Sejam X e Y variáveis aleatórias tendo densidade conjunta f- dada 
por (5). Na seção precedente determinamos vários momentos envolvendo X e Y. 
Determinaremos aqui a densidade condicional e a expectância condicional de Y 
dado X =x. 

A densidade marginal de X é dada por 


1 
ЛО) = nn — 1) Í (y = 2 dy 
= п(1 – х)"!, б-ти], 


e fy (x) = 0 para outros valores de x. Assim para O& x < 1, 
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a Юу 277? 
| fox) = (0-3 


0, para outros valores de у. 


5 х у, 


Conseqüentemente, рага 0<х < 1, 


) Е[ҮІХ = а] = | xfCy | x) dy 
] 1 
-(- Da - x7 [ y - 37 dy 
1 
== 11 — 3 [ fo xt x» 37] à 
с ex 
? € n NY n-—1 
= (n 20 Da = sA Б х) + х(1 х) | 
п п — 1 
НА н). ан. ДА 
| n 
| 
nae sex 
up 
Às vezes é conveniente calcular a expectáncia de Y de acordo com a fórmula 
(7) EY = ] E[Y| X = x]/dx) dx. 
| Esta fórmula é uma decorréncia imediata de (6). Para 
[trix хода | ax ores ne 
= [pore acd 
= 
| Aplicando esta fórmula ao Exemplo 9, obtemos 
| 1 == 
| ЕҮ = | (= t4) n(1— x)! dx 
] 0 п 
1 1 
- || (1 — 37 dx | (1 — х)" dx 
| 0 0 
| 1 п 
1 = 1 — = É 
1 п+1 п+1 


| que está de acordo com o resultado obtido no Exemplo 7. 
Pode-se naturalmente definir de uma forma semelhante as expectáncias con- 
dicionais para variáveis aleatórias discretas. 
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7.5. O TEOREMA DO LIMITE CENTRAL 


Através de toda esta seção Xi, X2, .. . representarão variáveis aleatórias 
independentes, identicamente distribuídas com média и e variância finita não-nula 
о?. Estaremos interessados em estudar a distribuição de 5, =X, +... + Xp. 
Observe antes de mais nada que S, tem média пи e variância no?. 

Suponha a seguir que X, tem densidade f. Então S, terá uma densidade - 
fsn para todo n 2 1, Sn. Como fs, — f, pode-se calcular sucessivamente as 
outras densidades usando as fórmulas obtidas nos Capítulos 3 e 6 para a densidade 
da soma de duas variáveis aleatórias independentes. Temos que 


fs) = X fs. Of — у) 
ou 


љо = | foe - 9) dy 


conforme o tipo da variável aleatória X, discreta ou contínua. Para certas escolhas 
de f (por exemplo, binomial, binomial negativa, Poisson, normal e gama), podemos 
obter fórmulas simples para fs,,. Entretanto, em geral temos que recorrer a métodos 
numéricos. | 
Um dos resultados mais importantes e extraordinários da teoria да probabi- 
lidade é que, para valores grandes de n, a distribuição de S, depende essencial- 
mente da distribuição de X, apenas através de и е o?. Pode-se discutir mais 
facilmente este resultado em termos de variável aleatória normalizada 


DS ES, S n 


so 
X Var S, o n 


que tem média O e variância 1. 

Para se ter uma idéia do comportamento da função de distribuição de 5; 
quando n > œ, consideremos inicialmente um caso especial em que a distribuição 
exata de Sh pode ser obtida facilmente. Suponha então que X, tem a distri- 
buição normal de média и e variância o°. Então, de acordo com os resultados 
do Capítulo 6, Sp distribui-se normalmente com média 0 e variância 1, ou em 
outras palavras, $5 tem a função de distribuição normal padrão Ф. 

Suponha a seguir que X, assume os valores 1 e O com probabilidades р 
e 1 — p, respectivamente. Então, como vimos no Capítulo 3, S, tem a distri- 
buição binomial de parámetros п e p; isto é 


PG, = 2 = (0) ra - ви" 


Foi descoberto por DeMoivre (1667-1754) e Laplace (1749-1827) que, neste caso, 
a função de distribuição de Sh se aproxima de Ф, a função de distribuição normal 
padrão, quando n > оо, 
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Houve mais recentemente diversas extensões do teorema limite de DeMorne- 
Laplace, todas conhecidas como “teoremas do limite central". О mais ssmpies е о 
mais conhecido desses resultados foi demonstrado por Lindeberg em 1922: 


Teorema 3. Teorema do Limite Central. Sejam X,, X,,... variáveis dee 
tórias independentes, identitamente distribuídas com média и е varnanciz 
finita não-nula o?. Seja S, = X; +---+Xy. Então 


(8) lim Р ($E < x) “Щу ao <х о. 


no ovn 


А generalidade deste teorema é extraordinária. A variável aleatória X, pode 
ser discreta, contínua ou mista. Além do mais, a conclusáo é válida mesmo que 
X, não tenha nenhum momento além do segundo. Outro aspecto bastante sur- 
preendente do teorema é que a distribuição limite de S} independe da distribuição 
específica de X, (naturalmente desde que as hipóteses do teorema sejam satis- 
feitas). Entretanto, não devemos ficar surpresos com o fato de que Ф é esta dis- 
tribuição limite, pois vimos que isto é verdade quando X, tem distribuição normal 
ou binomial. 

A demonstração do Teorema do Limite Central será adiada para o Capítulo 8, 
uma vez que ela requer técnicas avançadas ainda não discutidas que envolvem funções 
características. É possível dar uma demonstração elementar, porém, laboriosa do 
teorema de DeMoivre-Laplace, o caso especial do Teorema do Limite Central em que 
X, tem distribuição binomial. Existem maneiras elementares de tornar plausível 
o Teorema do Limite Central, mas elas não são demonstrações. Uma dessas maneiras 
é mostrar que se X, tem m-ésimo momento finito, então para qualquer número 
inteiro positivo m 


existe e é igual ao m-ésimo momento da distribuição normal padrão. 

Neste estágio é mais interessante compreender o significado do Teorema do 
Limite Central e ver como podemos aplicá-lo em situações típicas. 
Exemplo 10. Sejam X,,X,,... variáveis aleatórias independentes, identicamente 
distribuídas segundo uma distribuição de Poisson de parámetro A. Então, de acordo 
com os resultados do Capítulo 4, и =0? = А е Sn tem uma distribuição de 
Poisson de parámetro nà. O Teorema do Limite Central implica em 
: — nÀ 
lim P ($n ES J == Ф(х), —00 « х «00. 
у ПА 

Pode-se estender o resultado deste exemplo e mostrar que se X; ё uma 
variável aleatória com distribuição de Poisson de parámetro А = f, então 
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(9) lim p (5 = < x) = 69) uo «s = оо, 


сал Маг Х, 
A Equação (9) é também válida para o caso em que X; tem uma distribuição 
gama T(t, A) com Aà fixo ou uma distribuição binomial negativa de parâmetros 
a=tep fixo. 


7.5.1. APROXIMACOES NORMAIS. O Teorema do Limite Central sugere for- 
temente que para n grande devemos fazer a aproximação 


P (de — me = +) x Ф(х), = BO X < 00; 
суп 
ou equivalentemente 
(10) P(S, < x) ях Ф (=) 
ovn 
- 0 (=), —o < x < 00. 
VVar S, 


Nós nos referimos a (10) como uma fórmula de aproximacáo normal De acordo 


com esta fórmula, aproximamos a função de distribuição de S, pela função de 
distribuição normal de mesma média e variância. Uma dificuldade em aplicar a 
fórmula de aproximação normal é decidir sobre a ordem de grandeza de n para 
que (10) seja válida com um desejado grau de precisão. Diversos estudos numéricos 
indicam que em aplicações práticas típicas, n = 25 é suficientemente grande para 
que (10) seja válida. 

Como um exemplo em que a aproximação normal é aplicável, sejam X,,X,,... 
variáveis aleatórias independentes, cada uma com densidade exponencial de parâmetro 
A=1. Então (10) transforma-se em 


(11) P(S, < х) = Ф (= Ey, 


== « X < оо. 
уп 


Gráficos mostrando a precisão desta aproximação são dados na Figura 1 para п = 10. 


Função Real de Distribuição 
— — Aproximação Normal 
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Exemplo 11. Suponha que a duração de um certo tipo de lâmpada depois de 
instalada distribui-se, exponencialmente, com duração média de 10 dias. Quando 
uma lâmpada queima, instala-se outra do mesmo tipo em seu lugar. Obtenha a pro- 
babilidade de que sejam necessárias mais de 50 lâmpadas durante o período de um ano. 

Para resolver este problema representamos por *X, a duração da n-ésima 
lâmpada que é instalada. Supomos que X,, X,,... são variáveis aleatórias inde- 
pendentes com densidade exponencial de média 10 ou parámetro À = 1/10. Então 
Sn = X, +... + X, representa o tempo em que se queima a n-ésima lâmpada. 
Desejamos determinar P(Sso < 365). Sabemos que Sso tem média 50A ^! = 500 
e variância 50A-? = 5000. Assim, pela fórmula de aproximação normal (10) 


P(Sso < 365) = Ф E 
= Ф(— 1,91) = 0,028. 
É portanto bastante improvável que sejam necessárias mais de 50 lâmpadas. 
Suponha que S, é uma variável aleatória contínua com densidade fs,. 
Diferenciando os têrmos de (10) obtemos 


(12) fs 6) = E? e -=<х «m. 


Embora, a derivação de (12) esteja longe de ser uma demonstração, (12) 
é uma aproximação boa para n grande (sob a condição branda adicional de que 
fs, seja uma função limitada para algum n). 

Como um exemplo desta aproximação, suponha que X, se distribui expo- 
nencialmente com parâmetros А = 1, de modo que (11) é aplicável. Então (12) 
transforma-se em 


x — 


(13) | fs, = е (Хут). -=<п<=. 


Gráficos mostrando a precisão desta aproximação são dados na Figura 2 para п = 10. 


Função de Densidade Real 


0,15 


— — Aproximação Normal 


0,10 


0,05 
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As formas do Teorema do Limite Central дие envolvem densidades em lugar 
das funções de distribuição são conhecidas como teoremas do limite central “local”. 
Elas são também importantes, especialmente na teoria avançada da probabilidade. 

Existe uma aproximação semelhante a (12) para variáveis aleatórias discretas. 
Naturalmente o estabelecimento preciso de tal aproximação depende da natureza dos 
valores possíveis de S,, isto é, aqueles valores de x tal que fs, (х) = P(S, = х) > 0. 
Por simplicidade fazemos as duas hipóteses seguintes: 

(i) Se x é um valor possível de X,, então x é inteiro; 

(ii) Se a é um valor possível de X,, então o máximo divisor comum do 

conjunto 


{х—а|х é um valor possível de X, ) 


é um. 
Excluímos, por exemplo, a variável aleatória X, tal que P(X, = 1) = 
=P(X, =3)= 1/2, pois neste caso o máximo divisor comum do conjunto indicado 
é 2. Sob as hipóteses (i) e (ii), a aproximação 


А ! 
(14) fs, (x) = s Ф Ga , Xx inteiro 


é válida para п grande. 

Exemplo 12. Seja X, uma variável aleatória que assume os valores 1 e O com 
probabilidades p e 1 — p, respectivamente. Então (i) e (ii) são satisfeitas e (14) 
é aplicável com u =p e о? = р(1 – p). Como S, tem a distribuição binomial 
de parámetros п e p, temos a aproximação 


(15) fs.) 


(m or 


& 


— e| Сар. |. x inteiro 


Jai = p) Wapi — p) 


A Figura 3 mostra esta aproximação para n= 10 e p= 0,3. 

A Figura 3 nos conduz a outro método de aproximar fs, (х) no caso discreto, 
isto é, a integral do segundo membro de (14) sobre o conjunto [x — 1/2, x * 1/2]. 
Expressando essa integral em termos de Ф, obtemos como uma alternativa para (14) 


(16) fl) а O e) 
суп / 
E. ( -= (1/2) — пи 


суп 


| ч x inteiro. 


Figura 3 


A área da região sombreada da Figura 3 é uma aproximação para P(S, = 5). 
Finalmente somando (16) sobre o conjunto (...,x – 2,х – 1,х} 


ovn 


Quando $, é discreto e as condições (i) e (ii) se verificam, (17) é em geral 
mais precisa do que a fórmula original de aproximação normal (10). Na Figura 4 
comparamos as aproximações das fórmulas (10) e (17) quando S, tem a distri- 
buição binomial de parámetros n = 10 e p= 033. 


ES = 
(17) P(S, €x) =D | d , X inteiro, 


1,0 

0,8 De (17) 

0,6 
De (10) 

0,4 

0,2 

o 
0 2 4 6 8 10 

Figura 4 


Exemplo 13. Um certo jogador de basquetebol sabe que converterá em média 
60% dos seus lances-livres. Qual a probabilidade de que ele tenha êxito em mais 
da metade das vezes em 25 lances-livres? 

Suponhamos que a implicação do problema é que o número $, de sucessos 
em п lances-livres distribui-se binomialmente com parâmetros n e p = 0,6. Como 
P(S, 2х) = 1 – Р(5, €x — 1) obtemos de (17) a aproximação 
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[ттт a a Si 


x — (1/2) — nu E? 
CAMA ) x inteiro. 


Рага o nosso caso пи = 25(0,6) = 15 e oy n= vy 25(0,6)(0,4) = 5 0,24. 


Assim l 
"M 13 — (1/2) - 15 ч 
5 у 0,24 


1— Ф(— 1,02) 
Ф(1,02) = 0,846. 


(18) P(S >x) = 1 Ф ( 


Р(6,» > 13) 


I q 


37^ 


7.5.2. APLICAÇÃO À AMOSTRAGEM. Pode-se considerar o Teorema do Limite 
Central e as correspondentes fórmulas de aproximação normal como refinamentos 
da Lei Fraca dos Grandes Números discutida no Capítulo 4. Lembramos que esta 
lei estabelece que para n grande S,/n deve estar próximo de и com probabilidade 1. 
Entretanto, a lei fraca por si só não fornece informação alguma quanto a precisão de 
tal estimativa. Como vimos no Capítulo 4, a Densidade de Chebyshev lança alguma 
luz sobre esta questão. 

A fórmula de aproximação normal (10) é também útil neste contexto. 
Para c>0 


Em outras palavras 


Sn 
(19) Р (= -u >c) eX - Ф(5)), zi 
onde 
(20) Р 
9i hh 
Exemplo 14. Decide-se tomar uma amostra de tamanho n para determinar a Af 


porcentagem de eleitores que tencionam votar em determinado candidato em uma 
eleição. Seja Xg = 1 se o k-ésimo elemento da amostra tenciona votar no candi- 
dato e Хр = 0 caso contrário. Supomos que X,,..., X4 sejam variáveis aleatórias 
independentes, identicamente distribuídas, de tal sorte que Р(Х, = 1) = p e 


——————————————— 


Р(Х = 0) = 1 – р. Então u =p e о? — p(1 — р). Supomos também que о 
valor de р seja suficientemente próximo de 0,5 para que o = y p(1 =p) possa 
ser aproximado satisfatoriamente por o = 1/2 (observe que o tem um máximo 
de 1/2 para р = 0,5 e que o permanece acima de 0,3 < p < 0,7, quando c 
' varia de 0,458, o que é suficientemente próximo de 1/2). A variável aleatória 
Sn/n representa a fração de pessoas na amostra que tencionam votar no candidato, 
e pode ser usada para estimar a proporção verdadeira porém desconhecida, р. 
Usaremos as aproximações normais para resolver os três problemas seguintes: 
(i) Suponha que n = 900. Obtenha a probabilidade de 


Sn 


(ii) Suponha que n = 900. Determine c tal que 


n 


df 
n 


TIRE 


>e) = 0,01. 


(iii) Determine n tal que 


> ооз) = 0,01. 


п 


S, 
Е 


Solução de (i). De acordo сот (20) 


5 . (0025) /900 _ 


0,5 1,5, 


de modo que em virtude de (19) 
Sn 


ң =—-р| > 2025) & 2(1— Ф(1,5)) 
E = 20,067) = 0,134. 


Solução de (ii). Escolhemos inicialmente ô de tal forma que 2(1 — &(6)) = 
= 0,1 ou Ф(5) = 0,995. Uma inspeção da Tabela I mostra que ô = 2,58. Resol- 
vendo (20) em c obtemos 


Solução de (iii). Com em (ii), б = 2,58. Resolvendo (20) em п, obtemos 
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620? — (2,88)!(0.25) _ 


2663. 
c (0,025)? 


п = 


Vale а pena comparar os resultados de (ii) e (iii). Em ambos os casos 


sea р = e) = 0,01. 


n 
Temos c=0,043 e n — 900 em (ii), enquanto c — 0,025 e n — 2663 em (iii). 
Assim, para reduzir c proporcionalmente ao fator 43/25, somos forçados a au- 
mentar n proporcionalmente ao quadrado deste fator. Isto é válido em geral sempre 
que desejamos manter 


constante. Pois então $ é determinado por (19) e, de acordo com (20). п está 
relacionado com c pela expressão n = 8? 0?/c?. No mesmo contexto, se aumen- 
tamos n proporcionalmente a um dado fator, reduzimos c proporcionalmente 
à raiz quadrada do mesmo fator. 


Exercícios 


1. Suponha que X tem uma densidade Beta de parâmetros a; e о. Obtenha EX. 


N 


. Sejam X e Y aleatórias independentes tendo as densidades рата Г(0;, А) 
e I(a,, À) respectivamente. Seja Z = Y/X. Para que valores de o, e q 
terá Z uma expectância finita? Obtenha EZ quando ela existe. Sugestão: 
veja o Teorema 3 do Capítulo 6 e discussão sobre o mesmo. 
3. Suponha que X tem a densidade normal n(0,0?). Obtenha E | Х|. Sugestão: 
use o resultado do Exercício 31 do Capítulo 5. 

4. Suponha que X tem uma densidade exponencial de parâmetro A e que 
X. seja definido em termos de X e e>0 através de (1). Qual é a distribuição 
de X./e? Obtenha EX, e determine o seu limite quando e > 0. 

5. Suponha que X tem uma densidade Beta de parâmetros a, e оз. Obtenha 
os momentos e a variância de X. 

5. Suponha que X tem uma distribuição x? com п graus de liberdade. Obtenha 
amédia de Y = LX. 

7. Seja X a variável aleatória do Exemplo 7. Obtenha EX” a partir da densidade 

marginal fy. 


оо 


. Seja 7 a variável aleatória do Exercício 2. Obtenha a variância de 1. 


^ 


pD——————m 


ES 


pe 


ara 


— 


9: 


Sejam U, e U, variáveis aleatórias independentes que têm densidade expo- 
nencial de parâmetro À е seja Y = тах (U,, U,). Obtenha a média e va- 
riância de Y (ver Seção 6.5). 


. Seja X a variável aleatória do Exemplo 1 do Capítulo 5. Obtenha a média 


e variância de X. 


‚ Seja X a variável aleatória do Exemplo 1 do Capítulo 6. Obtenha a média 


e variância de X. Sugestão: reduza EX? a uma integral Beta. 


. Obtenha a média e variância da variável aleatória Z do Exercício 17 do Ca- 


pítulo 6. 


. Obtenha a média e variância da variável aleatória Y do Exercício 28 do Ca- 


pítulo 6. 


- Seja X o seno de um ângulo em radianos escolhido uniformemente em 


(—7/2, п[2). Obtenha a média e variância de X. 


. Suponha que X tem a densidade normal n(0, o? ). Obtenha a média e varián- 


cia das seguintes variáveis aleatórias: 


“XI; 


16. 


I7 


18. 


19. 


20. 


21. 


(b) X^; 

(c) etx, 

Suponha que X tem a densidade gama T(a, А). Determine os valores de 
t para os quais еѓХ tem expectáncia finita. Obtenha Ee'X para estes 
valores de f. 

Suponha que X tem a densidade Г(о, А). Determine os valores de r para 
os quais X" tem expectância finita. Obtenha EX” para estes valores de r. 


Seja X uma variável aleatória contínua não-negativa que tem densidade f e fun- 
ção de distribuição F. Mostre que X tem expectância finita se e somente se 


[а — Е(х)) dx < oo 
0 


e então 
EX = | (1 — Е(х)) ах. 
0 


Sugestão: veja a demonstração do Teorema 5 do Capítulo 4. 
Seja Хр о k-ésimo estatístico de ordem de uma amostra das variáveis aleatórias 
U,,..., Un que são independentes e se distribuem uniformemente em (0, 1). 
Obtenha a média e variância da Ху. 
Sejam X e Y as variáveis aleatórias do Exemplo 7 e seja R — Y — X. Obtenha 
a média e variância de К. Sugestão: use a Equação (16) do Capítulo 4. 
Suponha que X e Y tem a densidade f dada no Exercício 9 do Capítulo 6. 
Obtenha a correlação entre X e Y. 
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22. Sejam X e Y variáveis independentes tais que X tem a densidade normal 
n(u, о?) e Y a densidade gama Г(а, À). Obtenha a média e variância de 
Z-XY. 

23. Sejam X e Y variáveis aleatórias que têm média 0, variância 1 e correlação p. 
Mostre que X — pY e Y não são correlacionadas e que X — pY tem média 


Ое variância 1 — p°. 


24. Sejam X, Y e Z variáveis aleatórias que têm média O e variância 1. Seja 


pı а correlação entre X e Y, p; а correlação entre Y e Z e рз a cor- 
relação entre X e Z. Mostre que 


p12 103 — V1-pi У1—р. 


Sugestão: escreva 


XZ = [p1Y * (X руҮ)][рәҮ + (Z — p; Y)], 


e use o Exercício 23 e a desigualdade de Schwarz. 


25. Sejam X, Y e 7 como no exercício anterior. Suponha que p; 2 0,9 e 


pa 2 0,8. О que se pode dizer acerca de рз? 


26. Suponha que X e Y têm uma densidade f uniforme no interior do triân- 


gulo com vértices em (0, 0), (2, 0) e (1, 2). Obtenha a expectáncia condicional 
de Y dado X. 


27. Sejam X e Y variáveis aleatórias independentes tendo as densidades gama 


T(o, № e Tr(a, X), respectivamente, e seja Z — X * Y. Obtenha a expec- 
táncia condicional de X dado Z. 


28. Sejam П e Y as variáveis aleatórias do Exercício 26 do Capítulo 6. Obtenha 


aexpectáncia condicional de П dado Y. 


29. Sejam X e Y variáveis aleatórias contínuas tendo uma densidade conjunta. 


Suponha que Y e y(X)Y têm expectâncias finitas. Mostre que 


Eg(X)Y = Jes eG)ELY | X = x] fu) dx. 


30. Sejam X e Y variáveis aleatórias contínuas tendo uma densidade conjunta, 


е seja Var [Y | X = x] a variância condicional de Y dado X =x. Mostre 
-que se E[Y|X-x]- и independentemente de X. Então EY = u e 


Var Y. = i3 Var[Y| X = x]fx(x) dx. 


31. Sejam X,, X5, .. . variáveis aleatórias independentes, identicamente distri- 


buídas com média 0 e variância finita não nula о? eseja 5, =X; *--- * X, 
Mostre que se X, tem terceiro momento finito, então ES; =пЕХ? е 
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33. 


34. 


35. 


36. 


3T- 


38. 


3 
lim E (> -) = 0, 
n> n 
que é o terceiro momento da distribuição normal padrão. 


. Sejam X,,..., X, e Sn como no Exercício 31. Mostre que se X, tem 
quarto momento finito, então 


ES? = nEX1 + 3n(n — 1)o* 


lim Е (5 


-) = 
3, 
mo lon 
que é o quarto momento da distribuição normal padrão. Sugestão: o termo 
3n(n — 1) vem da expressão 
n| 4! 
2) 2121 


Suponha que X tem a densidade gama T(a, À). Obtenha a aproximação 
normal para P(X € x). 

Sejam X,, X,,... variáveis aleatórias independentes com distribuição normal 
de média O e variância о?. 

(a) Quais são a média e variância da variável aleatória Х1? 

(b) Como se deve aproximar Р(Х? +... + X2 €x) em termos de Ф? 

Sejam X,, X,,... variáveis aleatórias independentes com distribuição normal 
de média O e variância 1 (ver exercício anterior). 

(a) Determine Р(Х? +... +X2o0 < 120). 

(b) Determine P(80« X ns -+ Х оо < 120). 

(c) Determine с tal que P(X? + - «+ X2oo < 100 + c) = 0,95. 

(d) Determine c tal que P(100 - —c&XÀ1 *---* X1oo < 100* c) = 0,95. 
Um corredor procura controlar seus passos em uma corrida de 100 metros. 
Seus passos distribuem-se independentemente com média и = 0,97 metros 
e desvio padráo о = 0,1 metros. Determine a probabilidade de que 100 passos 
difiram de 100 metros por não mais de 5 metros. 


Arredonda-se vinte nümeros para o inteiro mais próximo e soma-se os nümeros 
resultantes. Suponha que os erros individuais de arredondamento são inde- 
pendentes e-se distribuem uniformemente em (—1/2, 1/2). Determine a pro- 
babilidade de que a soma obtida difira da soma dos vinte números originais 
por mais de 3. 

Lança-se uma moeda equilibrada até observar 100 caras. Determine a proba- 
bilidade de que sejam necessários 226 lançamentos no mínimo. 
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39. 


40. 


41. 


43. 


45. 


46. 


No exercício anterior determine a probabilidade de que sejam necessários 
exatamente 226 lançamentos. 
Suponha que X tem uma distribuição de Poisson de parâmetro A. 


(a) Como se deve aproximar fy(x) em termos da densidade normal padrão y? 

(b) Como se deve aproximar fy(x) em termos da função de distribuição 
normal padrão &? 

Suponha que $, tem uma distribuição binomial de parámetros n e p — 1/2. 

Como se comporta P(S,n = n) para n grande? Sugestão: use a aproxi- 

mação (15). 


. Os jogadores 4 e B fazem uma série de apostas de $1 em que cada jogador 


tem probabilidade 1/2 de ganhar. Seja S, а quantia ganha pelo jogador А 
após n apostas. Como se comporta P(S5, = 0) para n grande? Sugestão: 
veja o problema anterior. Por que (15) não é diretamente aplicável neste caso? 
Os candidatos 4 e B concorrem a um cargo e, 55% do eleitorado apoia o 
candidato B. Qual é a probabilidade de que em uma amostra de tamanho 100, 
pelo menos a metade dos entrevistados apoiem o candidato А? 


. Uma firma de pesquisa de opinião pública entrevista 1200 eleitores para estimar 


a proporção dos que planejam votar no candidato 4. Qual deve ser a verdadeira 
proporção p para que o candidato 4 possa estar 95% certo de que a maioria 
dos entrevistados votarão nele? 

Suponha que o candidato А do problema anterior insiste que o tamanho da 
amostra deve ser tal que se 51% de todos os eleitores o favorecem, ele pode 
estar 95% certo de obter a maioria dos votos na amostra. Qual deve ser 
o valor de n? 

Resolva o Exercício 27 do Capítulo 4 usando a aproximação normal. 
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FUNÇÕES GERATRIZES DE 
MOMENTOS E 
FUNÇÕES CARACTERÍSTICAS 


Alguns dos instrumentos mais importantes na teoria da probabilidade provêm 
de outros ramos da matemática. Discutiremos neste capítulo dois de tais instru- 
mentos intimamente relacionados. Começaremos com funções geratrizes de mo- 
mentos e a seguir trataremos de funções características. Estas são de compreensão 
um pouco mais difícil em nível elementar porque requerem o uso de números com- 
plexos. Entretanto vale a pena superar este obstáculo, pois o conhecimento das 
propriedades das funções características nos permitirá demonstrar tanto a Lei Fraca 
dos Grandes Números como o Teorema do Limite Central (Seção 8.4). 


8.1. FUNÇÕES GERATRIZES DE MOMENTOS 


Define-se a função geratriz de momentos Мух(ї) de uma variável aleatória 
X através de 


Mx(t) = Ee'X, 


O domínio de M x é constituído por todo real £ para o qual e'X tem expectância 
finita. | 
Exemplo 1. Seja X uma variável aleatória com distribuição normal de média 
u e variância о?. Então 
My) = о | e ne e [x u)2/202] dx 
=® Е сот 


со 
| еэ +) 1 етУ?129? dy 
90 су 2л 


А 1 
= e | — g7 02120?) dy. 
so ox 2n 


De icem a 
aos. 39s 2 


Conseqüentemente 


Mt) = e"te 2 e 1 


= e OAP 22) dt. 
= т\/2л s 


Como a última integral representa a integral da densidade normal n(c?r, o°), 
seu valor é um e portanto 


(1) My(f) sentes? P, „гш А 


Exemplo 2. Suponha que X tem а densidade gama de parâmetros а е А. Então 


My(t) = | е Ha ж еа 
0 a 


ле 


= A Y: х 7 1g-(-0x dx 
I(o) Jo 
au TO) 
T(a) (4 — t)* 
para —°°< ft <А. A integral diverge para A & f < o». Assim 
: En 
(2) My(t) = pae , —% << А. 


Suponha agora que X é uma variável aleatória discreta cujos valores possíveis 
são todos inteiros não-negativos. Então 


M(t) = У e"P(X = n). 


No Capítulo 3 definimos a função geratriz de probabilidades de tais variáveis alea- 
tórias como 


wu) V FRA ги). 

п= 0 
Das duas fórmulas acima torna-se claro que 
(3) Mx(t) = Фу (e! ). 
A fórmula (3) nos permite obter a função geratriz de momento diretamente da 
função geratriz de probabilidade. Por exemplo, se X tem uma distribuição bino- 
mial de parâmetros n e p, então como foi visto no Exemplo 16 do Capítulo 3, 

ФуС Е (рет тру, | 


Segue-se imediatamente que 


Mx(t) = (pe! + 1—p)". 


а 


qc 111 1t ————————————n | 


Analogamente, se X tem uma distribuição de Poisson de parâmetro A, então 
de acordo com o Exemplo 18 do Capítulo 3, 


y(t) =е%-1Җ% 
Conseqüentemente 
My(t) = exe! 1), 


Naturalmente nestes dois exemplos M y (f) poderia também ser facilmente obtido 
diretamente da definição de função geratriz de momento. 

Se X e У são variáveis aleatórias independentes, e!X е e!” são também 
independentes. Conseqüentemente 


Mysy(t)=Ee!X+7) = EetX et Y = EetXEetY 


=My(t)My(t). 
Segue-se facilmente que se X,,..., Xn são independentes e têm a mesma dis- 
tribuição, então ; 
(4) Myr a a Xu D Obr 0^. 


Para ver a razão pela qual chamamos My(t) função geratriz de momento, 
escrevemos 


Px 


M(t) = Ee* = EE: 


Suponha que My(t) é finito em —to < t < fo para algum número positivo to. 
Neste caso pode-se mostrar que é lícito inverter a ordem de expectância e somatório 
na última expressão de M y(t). Em outras palavras j 


ЕХ" E 
(5) My(t) = PE S 2 
=o n! 
para —to < t < fg. Em particular,.(5) é válido para todo t se My(t) é finito 
para todo f£. A série de Taylor por M y(t) é 


ot d" 


(6) My(t) = 93 Муй) _ 


n! dt" 
Comparando os coeficientes de t” em (5) e (6), vemos que 
7 ЕХ" сы M (t) 
= — t 
(7) dino + (2) t=0 
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Exemplo 3. Suponha que X se distribui normalmente com média O e variância о?. 


Use a função geratriz de momentos para obter os momentos de X 


Observe inicialmente de (1) que 
© 2{2 п 1 
Мейу есе? = (=) ES 
rev PE EIE 
=, o” 12", 


n=0 2"n! 
Assim os momentos de ordem ímpar de X são iguais a zero, e os momentos de 


ordem par sáo dados por 


ЕХ?" д?п 
(2n)! | 2"n! 
ou 
o?" (2n)! 
2 = 
ке 08 2" n! 


Isto está de acordo com os resultados obtidos no Capítulo 7. 
Este exemplo pode ser usado para ilustrar (7). Uma vez que 


d c? t*/2 – д2 teo? t? [2 


mei 


dt 
e 
2 
6. o7 cd = (02 *o*12)eo* t* 2, 
dt 
segue-se que 
d г 
— e 2 = 0 
dt t-0 
e 
E 20?12/2 с? 
2 cd , 
dt t=0 


que são simplesmente os dois primeiros momentos de X. 


8.2. FUNÇÕES CARACTERISTICAS 
Define-se a função característica de uma variável aleatória Х como 
\ 


ex(t) = EeifX, — Lee t oo, 


= у — 1. As funções características são um pouco mais complicadas do 


onde i = А 
que as funções geratrizes de momento, na medida em que envolvem números com- 
plexos. Entretanto elas possuem duas vantagens importantes em relação as funções 
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geratrizes de momentos. Em primeiro lugar vx(:) é finito para todas as variáveis s 
aleatórias X e todos os números reais г. Em segundo lugar, a função de distri- 

buição de X e em geral a função de densidade, quando existe, podem ser obtd 
da função característica através de uma “fórmula de inversão”. Usando as proprie- 
dades das funções características poderemos demonstrar a Lei Fraca dos Grandes 
Números e o Teorema do Limite Central, o que não era possível através de funções 
geratrizes de momento. 


as 


Antes de discutir as funções características faremos um breve resumo de alguns 
fatos complexos, envolvendo variáveis, que serão necessários. 

Podemos escrever qualquer número complexo z na forma 2 = х + іу, onde 
| x e y são números reais. Define-se o valor absoluto |2 | de um número complexo 
2 através de |2| = (x? + y?)^. Define-se a distância entre dois números complexos 
Z1 е Z} como sendo |z; — z; |. 

Se a função de uma variável real tem uma expansão em série de potência com 
um raio de convergência positivo, podemos usar esta série de potência para definir 
| uma função correspondente de uma variável complexa. Assim definimos 


N 


© 
= у, 
п=0 


E 


para qualquer número complexo 2. A relação 
е21 +7, = е2, e? 


permanece válida para todos os números complexos 2, e 2,. Fazendo 2 = if, 
onde t é um número real, vemos que 


so Sur 
»-o n! 


2 3 4 45 
(на-на) 
2 1 o4 57 


DS 
(а), 
3! 5! 


Como as duas séries nesta última expressão correspondem a cos £ e sen Г, segue-se que 


e 


It 
eme 
| 
DIS 
> 
ТЕ 
| 
en 
$ 


| (8) ей = cos t +i sen t. 
| Usando a fato de que соѕ (7) = cost e sen (—t)= — sen t, vemos que 
| e- it = cost — i sen t. 


Dessas fórmulas podemos obter cost e sent: 
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eit 4 e- it eit езп 
(9) GoSp————————— e Senf === 
2 2i 


Segue-se também de (8) que 
| eit | = (cos? г + sen? г)“ = 1. 


Se f(t) e g(t) são funções reais de t, então h(t)=f(t)+ ig(t) define uma 
função complexa de t. Podemos diferenciar h(t) diferenciando f(t) e g(t) 
separadamente, isto é, 


h'(t)=f'(t)+ig'tt), g 


desde que f'(t) e g'(t) existem. Da mesma forma definimos 


b b b 
Í h(t) dt = Í f(t)dt + 1) g(t) dt, 
desde que as integrais indicadas envolvendo f e g existem. A fórmula 


a eot oct 


é válida para qualquer constante complexa c. O teorema fundamental de cálculo 
continua válido e, em particular, se c é uma constante complexa não-nula, então 
rb cb ca 

еа = 
Ја с 


Pode-se escrever uma variável aleatória complexa Z na forma Z = X + iY, 
onde X e Y são variáveis aleatórias reais. Define-se sua expectância EZ como 


EZ = E(X +iY)=EX +iEY 


sempre que EX e EY forem bem definidas. Como no caso das variáveis aleatórias 
reais, Z tem expectância finita se, e somente se, Е |Z | < оо, e neste caso 


IEZI < Е|2| 
A fórmula 


Е(а,2, + а,2,) = a1 EZ, * a4 EZ» 


é válida quando a, e a, forem constantes complexas e Z, e Z; forem variáveis 
aleatórias complexas com expectância finita. 


Representamos por X e Y, com ou sem subscritos, as variáveis aleatórias 
reais. Assim,na frase “seja X uma variável aleatória...” fica subentendido que se 
trata de uma variável aleatória real. 

Suponha então que X é uma variável aleatória e t é uma constante (reservamos 
o símbolo f para constantes reais). Então, |ейХ |= 1, de modo que еХ tem 
expectância finita e a função característica py (f), —99 « t « oo, dada por 


ex (t) = EeiftX, — -ooc too, 
é bem definida. Vemos que oy (0) = Ee? = Е1 = 1 e, para —% < t € es, 
lox (© l| = IEeitX| < EjeitX| = E1 = 1. 


A razão pela qual funções características são finitas para todo t, enquanto funções 
geratrizes de momento, não são finitas em geral é que ей, —œ< t< оо, é limitada, 
enquanto e, -o<t< о, não é limitada. 

Exemplo 4. Seja X uma variável aleatória que assume o valor а com a probabi- 
lidade 1. Então 


ex (t) = EeitX = eita, —оо<[< оо, 
Em particular, se X assume o valor zero com probabilidade 1, sua função carac- 


terística é identicamente igual a 1. 
: Se X é uma variável aleatória e, a e b são constantes reais, então 


Parpxlt) = Ego * 0D 
= Ее'а@е!Х 
= gia ia 
de modo que 
(10) Pa+bx(t)=e"1py(bt) ^ —«t«o. 


Exemplo 5. Suponha que U se distribui uniformemente em (— 1, 1). Então 
para £0 


1 T 1 
омо = | e du 


Para a « b seja 
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жез оз с 
2 E 


Então X distribui-se uniformemente em (a, b), е de acordo com (10) para г = 0 


ex (t) = eitta+b)a sin ((b — a)t/2) 


(b — a)t/2 4 
Alternativamente | 

Күү 1 

Qx(t) = | er dx 
a b == 

1 ейх b i 
b жа а dt a < 

Е 

ib — a) 


É fácil checar por meio de (9) que estes dois resultados estão de acordo. 
Exemplo 6. Suponha que X tem uma distribuição exponencial de parâmetro À. 
Então i 


ox) = | eie = dx 
0 : 
= À | ы 
0 


| o 
| = 4 ТЕС 
A-—it | oo 


Como limy» €-^* = 0 e e/f* é limitado em x, segue-se que 
x qu 


hast pa ot 
x00 х- = 
Assim 
LZ $13 Dec ч Pa 


Suponha que X e Y são variáveis aleatórias independentes. Então eitX 
e eitY são também variáveis aleatórias independentes; consequentemente 


Фх+ү(ї) = Eeit(X+Y) = FeitXeitY = EeitX EeitY 
e portanto 


(11) ex«y(t) -ex(t)ey(t, | —9«t«o. 
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Pode-se estender a fórmula (11) para mostrar que a função característica da soma 
de um número finito de variáveis aleatórias é o produto das funções características 
individuais. 

Pode-se mostrar que yx(t) é uma função contínua de f. Além do mais, 
se X tem momento finito de ordem п, então n2 (f) existe, é contínua em f, 
e pode ser calculada como 


ie Ger o7 ES ИХ 
ey ge gu Gf x = E(iX)" eitX, 


Em particular 
(12) e (о) =" ЕХ". 
Podemos tentar expandir фу (t) emsérie de potência de acordo com a fórmula 


PEX" 
n! 


(13) od ec np MEE. t", 


n=0 n! 


Suponha que 


© ЕХ" » 
My(t) = У с. 
n=0 П. 
é finito em —to < t «tg рага algum número positivo to. Então (13) é também 
válido em —tg <t<to. 
Exemplo 7. Suponha que X se distribui normalmente com média O e variância 
о?. Obtenha ox(t). 
Sabemos do Capítulo 7 que EX" = 0 para qualquer número inteiro positivo 
ímpar n. Além do mais, se n = 2k é um inteiro par, então 


c^" QE! 


ЕХ" = ЕХ? = 
2*k! 


Portanto 


© HEX ?* F © (—0212/2)* R 

t) = ——— f ES a = e o I2 
ext) = 3 Opi Pr 
De uma forma mais geral suponha que X se distribui normalmente com média 
и e variância о?. Então, Y = X — и distribui-se normalmente com média Ое 
variância о?. Como X = и + Y, vemos da fórmula (10) e do Exemplo 7 que 


(14) px(t)=eitue PP, — - oo t on, 
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Seja X uma variável aleatória cuja função geratriz de momento é M y(t) 
finitaem —to << ѓо para algum número positivo fọ. Como 


My(t) = Ee! X 


ex (t) = Еейх, 
deveríamos esperar que 
(15) ex (tr) = Mx Gt). 


Em outras palavras, deveríamos esperar que substituindo f£ рог if, na fórmula 
da função geratriz de momento, obteremos a fórmula da função característica 
correspondente. Isto realmente acontece, mas a compreensão total dos problemas 
envolvidos requer um conceito sofisticado (continuação analítica) da teoria de 
variável complexa. 

Como um exemplo de (15), suponha que X se distribui normalmente com 
média и e variância o?. Então como já vimos 


My(t)=e uteo?t? [2 
e portanto 


M xy (it) = en (it) goa? (її)? [2 
zelute—c* t? [2 


que de acordo com (14) é yy(t). 


8.3. FÓRMULAS DE INVERSÃO E O TEOREMA DA CONTINUIDADE 


Seja X uma variável aleatória inteira. Sua função característica é dada por 
ба = 
ext) = Y fds). 


Uma das propriedades mais úteis de v y (1) é que ela pode ser usada para calcular 
fx(k). Especificamente temos a “fórmula de inversão” 


NEM MET 
(16) л =, [etes de 


Para verificar (16) escrevemos o segundo membro desta fórmula como 
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X 
Г. «098 


Ag 


LL. 


E | «|$ еу] ar 


2л =g o0 
Um teorema da teoria de integração justifica a inversão da ordem de integração e 
somatório para obter a expressão 


Y 01 | ei dr, 
— 00 T 


Y m 
4 - 
| Para completar a demonstração de (16) devemos mostrar que a última expressão 

é igual a f y (А). Para isso é suficiente mostrar que 

EV [* дыш se ј = К, Ў 

t "n 2л J-x s e 0 Бы j а К. 

A fórmula (17) é óbvia quando j = k, pois neste caso eiU-k)t = 1 para todo 

t. Se + К, então 

Ж. л а-и p Ы В ЮЦЕ 
2n J-x 2ni(j — К) 
giG- 9r — ei- 
КЕТЕ) 
„ЖаШ o 
n(j — k) i 

pois sen тт = 0 para todos inteiros т. Isto completa a demonstração de (17) 

e portanto de (16). 

Exemplo 8. Sejam Х,, X,,..., X, variáveis aleatórias inteiras independentes е 

identicamente distribuídas e seja $, = X, +---+X,. Então s, (t) = (ех, (t))”, 

e conseqüentemente de acordo com (16) 

1 З ==} п 
(18) f = > [eo oy dr 
2x J-z 

) A fórmula (18) é a base para quase todos os métodos de analisar o comportamento 


de fs,(k) , para valores grandes de п e, em particular, a base para demonstração 
do Teorema de Limite Central “local” discutido no Capítulo 7. 

Existe também um análogo de (16) para variáveis aleatórias contínuas. Seja X 
uma variável aleatória cuja função característica v y (1) é integrável, isto é, 


F ораг: оо, 


Pode-se mostrar que neste caso Х é uma variável aleatória contínua сија densidade 
fx é dada por 
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(19) foc Í е1) dt. 
2л 


— 00 


Exemplo 9. Suponha que X se distribui normalmente com média O e variância 
c?. Mostraremos diretamente que (19) é válido para tal variável aleatória. Do 
Exemplo 7 sabemos que a função característica de X é yy(t)=e7 о?1? |2. Assim 


pela definição de funções características, 


22 2 i 1 2/202 
e” tz | ei! e с. [2а dx. 


== су 2x 
Se substituimos £ por —t e о рог 1/0 nesta fórmula ela se transforma em 


© 

—42/2в62 тей с 6262 

ehe e| e — e CX dx 
cues V2m 


ou equivalente 
1 -12/2a? 1 "E —itx ,—o?x?[2 
——— m mora qt c dy 
ov 2n 2л — 00 
Finalmente, invertendo as funções dos símbolos x e't па última equação obtemos 


ЫЛ. g n м a n e` REL 
ov 2n 2л J-o 
que é simplesmente (19) neste caso especial. 
Seja agora X uma variável aleatória qualquer. Seja Y uma variável aleatória 
independente de X que tem a distribuição normal padrão, e seja c uma constante 
positiva. Então X + cY tem a função característica 


Pre m 


Como yx(t) é limitado em valor absoluto por 1 e е—©**/2 é integrável, segue-se 
que X + cY tem uma função característica integrável. Conseqüentemente (19) 
é aplicável e Х + сҮ é uma variável aleatória tendo uma densidade dada por 


о 


Ачаб) = > | e^ yt) "^ qr. 
л 


Se integramos ambos os lados desta equação sobre a & x € b e invertemos a ordem 
de integração, concluímos que 


b © 
Р(а = Xp el = Б) : (| e "gie to а) ах 


— 00 


b 
(| (axis dx) ox(t)e ^"? dt 


ou 


J © еі! = січ ss 

(20) P(a<X+ecY<b)= je (e ) ips(t)e di 
2л =n 

A importância de (20) é que é válida para uma variável aleatória arbitrária X. 

O segundo membro de (20) depende de X apenas através de y y (t). Usando 
este fato e fazendo c > O em (20), pode-se mostrar que a função de distribuição 
de X é determinada pela sua função característica. Este resultado é conhecido 
como “teorema de unicidade” e pode ser enunciado como segue: 


Teorema 1. Se duas variáveis aleatórias têm a mesma função característica, 

elas têm a mesma função de distribuição. 
Exemplo 10. Use o teorema de unicidade para mostrar que a soma de duas variáveis 
aleatórias independentes normalmente distribuídas têm distribuição normal. 

Sejam X e Y variáveis aleatórias independentes distribuídas segundo 
n(u,01) e п(и,, 02), respectivamente. Então 


iuit ,—201?02/2 


Qx(t) = ele 


pt) = ee” 
Conseqüentemente 


> Фх+ү(1) Ii gU * i257 (912+022)02/2. 
Assim a função característica de X + Y é a função característica de uma variável 
aleatória com distribuição normal de média u + из e variância o? + o2. Pelo 
teorema de unicidade esta deve ser a distribuição de X + Y. 

A aplicação mais importante da fórmula de inversão (20) é que dis pode ser 
usada para derivar o resultado seguinte, que é a base da demonstração da Lei Fraca 
dos Grandes Nümeros e do Teorema do Limite Central. 


Teorema 2. Sejam Xn, п> 1, e X variáveis aleatórias tais que 


Q1) lim gx (t) = Ф), -0 « t « oo. 
Então 
(22) lim Ру (х) = F(x) 


em todos os pontos x onde F, é contínua. 


Este teorema estabelece que a convergência das funções características implica 
na convergência das funções de distribuição correspondentes ou, em outras palavras, 
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que as funções de distribuição “dependem continuamente” de suas funções carac- 
terísticas. Por esta razão o Teorema 2 é conhecido comumente como “Teorema 
da Continuidade”. 

A demonstração deste teorema é razoavelmente complicada. Não apresen- 
taremos os detalhes da demonstração, mas indicaremos brevemente as idéias prin- 
cipais de um método de demonstração. | 

Escolhemos em primeiro lugar uma variável aleatória Y que tem distribuição \ 
normal padrão е é independente das variáveis aleatórias Х„,п > 1. 

Seja a « b e seja c uma constante positiva. Então pela fórmula de in- 
versão (20) 


ERR 


— 


1 f* со е“ R e`” =з à 
Quy Bux X, EO eMe | [== ЕГ аш. 
c № —i 


2n 
e 
1 ^ о e '* sed еі -enja 
Q4) Pa<X+cr<b=- E. | Е m : ox(t)e dt. 
ч N J- a | 


Por hipótese, ox, (t) > yx(t) à medida que n > с. Por um teorema da teoria 
da integração, segue-se que o segundo membro de (23) converge para o segundo 
membro de (24) à medida que n >œ. Conseqüentemente 


(25) lim. P(a = X, + ёт «c b)—P(u = Хеу = 0р). 


no 


Existem mais duas etapas para a demonstração do teorema. Primeiro mostrar (fazendo 
a>-—o em (25)) que 


(26) Im РОС Her < b) = Р(Х + cy< Б). 


noc 


Finalmente mostrar (fazendo c > 0 em (26)) que 


lim P(X, < b) = P(X < b) 


no 


Sempre que Р(Х = b) = 0. O último resultado equivale à conclusão do teorema. 


8.4. A LEI FRACA DOS GRANDES NÜMEROS E O TEOREMA DO LIMITE 
CENTRAL 


Usaremos nesta seção o Teorema da Continuidade para demonstrar os dois 
importantes teoremas da teoria da probabilidade mencionados no título desta seção. 
Ambos os teoremas foram discutidos sem demonstração em capítulos anteriores. 
Para demonstrar estes teoremas precisamos inicialmente estudar o comportamento 
assintótico de log x (t) próximo de t = 0. 


Seja 2 um número complexo tal que |z — 1| < 1. Podemos definir log z 
através da série 


ED". =P 
= E — — Ф — С 
log 2 (z — 1) 3 3 
(outras definições de log z são necessárias para |z — 1| > 1). Com esta definição 
temos as propriedades usuais de que log 1 = 0, 


pestes z- 1<, 


ese A(t), a «t «b, é uma função complexa diferenciável tal que | £(1) — 1| « 1, 
então 

d h'(t) 

~ Jogh(t) ==. 

a — асу 

Seja X uma variável aleatória tendo função característica yy(t). Então 

Фх(ї) é continuae yy(0)=1. Assim logyxy(t) é bem definido para £ próximo 
de Ое log yy (0) = 0. 


Suponha agora que X tem média finita u. Então yy(t) é diferenciável 
e, de acordo com (12), vx(0) = iu. Portanto 


lim i == 
0 t 120 t— 0 


Nt 
= — log ox(t) 
dt 1=0 


_ 930) 
Фх(0) 
= ір. 
Conseqüentemente, 
(27) ior PE Aa o, 
1>0 t 


“Suponha a seguir que X também tem variância finita o°. Então qy(f) é dife- 


renciável duas vezes e de (12) 
9x0) = —EX? = —(u? + o°). 


Podemos aplicar a regra de l'Hóspital para obter 
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Фай) _, 
log e(t) — ipt sdy С 
a е ом р Un 5 = lim = 
1>0 t 1>0 2t 


= tim XD — inex(t) 


xo 219 xt) | 
= tim HD — inex(t) | 
1>0 2t 
Uma segunda aplicação da regra de l'Hóspital mostra que | 


lim 198 гш _ ФХ0) — ingx(0) 


1>0 t 2 i 
zc + ө) — (ш) 
2 
pou cpm 
7 : 
Em outras palavrás 
ET ^ 
Q8) ши E20 Ri RN 
1+0 t 2 


Teorema 3. Lei Fraca dos Grandes Números. Sejam X,, X5,... variáveis 
aleatórias independentes, identicamente distribuídas tendo média finita и 
е ѕеја Sn = X, + --- + X,. Então para qualquer e> 0 


(29) lim Р (122 – y > г) =0. 


no п / 
Demonstração. A função característica de 


E d TS S d 


um hie ^. 


етін (рух, (t/n). 


Suponha que t é fixo. Então para n suficientemente grande, t/n está próximo 
de zero o bastante para que log v y, (t/n) seja bem definido e 


(30) e^ "(ox (tn) = exp [nog ox (tn) — 1(:/п))]. 
А seguir afirmamos que 


(31) lim n(log ox,(t/n) — ip(t/n)) = 0. 
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A Equação (31) é óbvia para г = 0 uma vez que log yy, (0) —1og 1 = 0. Se £0 
podemos escrever o primeiro membro de (31) como 


t lim log ox(tín) e iu(t/n) а 
n> 0 tjn 


Mas tim > O à medida que л >œ, de modo que o último limite é Q de aade com 
(27). Isto completa a demonstração de (31). Segue-se de (30) e (31) que a função 
característica de 


Sn 


n E 


se aproxima de 1 à medida que n > œ, Mas 1 é a função característica de uma 
variável aleatória X tal que Р(Х = 0) = 1. A função de distribuição de X é dada por 


1 se x20, 
Edo = Lo se х < 0. 


Esta função de distribuição é sempre contínua exceto para x = 0. Seja є > 0. 
Pelo Teorema da Continuidade, 


(32) lim P ZLS -°) = F(-£)2-0 
п— = п 

е = 
s 
lim Р (Se — д < е) = Fy(e) = 1. 
no n 


O ültimo resultado implica que 


lim Р (Š - p > e) = 0, 
n> 00 n 
que juntamente com (32) mostra que (29) é válido como desejado. 

Para o teorema seguinte é necessário lembrar que Ф(х) representa a função 
de distribuição normal padrão dada por 


Ф(х) = | A e? dy, -0 < x < c. 
CN 


Lembramos também que esta função de distribuição é contínua para todos os valores 
de x. 


Teorema 4. Teorema do Limite Central. Sejam X,, X,,... variáveis 
independentes, identicamente distribuídas tendo média и е variância finita 
não-nula o?. Então 
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Demonstração. Seja 
Sn — ny 
ovn ` 


Então para t fixoe n suficientemente grande, 


S 


psdt) = ет "le ^o. (суп) 


= emilio (ауп), 
оц 


(33) Ost) = exp [n(log py (ton) — ig(t/ov n))]. 


А seguir afirmamos que 
E ça [2 
(34) lim n(log px (ton) — iu(tlov/n)) = —— 


> B 


РА 


Se t = 0, ambos os membros de (34) são iguais а zero е (34) é obviamente válido. 
Se 1 0 podemos escrever o primeiro membro de (34) como 


1? jm 108 ex [e m) — inlilovn) 
а? n>a (tov n? i 


que de acordo com (28) é igual a 


Hs в? i2 
o? i5) amet Ta 


Assim (34) é válido para todo t. Segue-se de (33) e (34) que 


lim gss(t) = e??? —00 <t< o. 


nx 
2 2 25 NY: :4 
De acordo com o Exemplo 7 e-~" /? é a função característica de uma variável 


aleatória X tendo a função de distribuição normal padrão Ф (x). Assim pelo 
Teorema de Continuidade. 


lim P(SÊ < x) = Ф(х), — 0 < x < осо, 


п— о 


que é a conclusão desejada. 


Exercícios 


1. Suponha que X se distribui uniformemente em (a, b). Obtenha My(t). 

2. Expresse a função geratriz de momento de Y =a + РХ em termos de My(t) 
(onde a e b são constantes). 

3. Suponha que X tem distribuição de Poisson de parámetro А. Use a função 
geratriz de momento para obter a média e variância de X. 


pueunmmm—————————— 


4. Suponha que X tem distribuição binomial negativa de parâmetros а e p. 
(2) Obtenha a função geratriz de momento de X. 
(b) Use esta função geratriz de momento para obter a média e variância de X. 


5. Seja X uma variável aleatória contínua tendo a densidade f'y (x) = (1/2)e- ! * ! 
—% < x < оо, 


ү (a) Mostre que My(t) = 1/(1— 12), —1«t« I. 
(b) Use esta função geratriz de momento para obter uma fórmula para EX?" 
(observe que os momentos ímpares de X são todos zero). 


6. Suponha que X tem distribuição binomial de parámetros п e p. 


i (a) Obtenha dM x (t)/dt e d?Mx(t)/d?^ . 
(b) Use (a) e a fórmula (7) para obter a média e variância de X. 


7. Sejam Ху, ... , Xn variáveis aleatórias independentes identicamente distri- 
buídas tais que M y, (t) é finito para todo f. Use funções geratrizes de mo- 
mento para mostrar que 


E(X, = ОБСЕ Дар = nEX3 + 3n(n — DEX?EX, 
+ n(n — Dn — 2XEX y. 
“Sugestão: obtenha (d?/dt?)(M y (t))'|, o. 


8. Seja X uma variável aleatória tal que M y(t) é finito para todo t. Use o 
mesmo argumento da demonstração da Desigualdade de Chebyshev para concluir 
que 


P(Xzx)«e-'*Mry(t) 120 
Segue-se que 
| Р(Х > x) x mine Мм), 
t20 


desde que e х My(t) tenha um mínimo em 0< t< ©. 

| 9. Suponha que X tem distribuição gama de parâmetros а e А. Use o resultado 
do Exercício 8 para mostrar que P(X > 2о/\) < (2/e)*. 

S 10. Suponha que X tem distribuição de Poisson de parâmetro А. Obtenha фу (2). 
| 11. Suponha que X tem distribuição geométrica de parámetro p. Obtenha y y(t). 


12. Sejam X,, X2, . .. , Xn variáveis aleatórias independentes, cada uma com 
i distribuição geométrica de parámetro p. Obtenha a função característica 
| de Х= Ху +...+Х,. 
13. Sejam X,, X2, . .. , Xn variáveis aleatórias independentes, cada uma com 
distribuição exponencial de parâmetro A. Obtenha a função característica 
de X— X, +...+X,. 
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14. 


[5. 


16. 


18. 


20. 


999 


Seja X uma variável aleatória discreta cujos valores possíveis são todos inteiros 
não-negativos. Que relação deveríamos esperar que exista entre a função carac- 
terística de X e a função geratriz de probabilidade de X (lembre-se das fór- 
mulas (3) e (15))? 

Seja X uma variável aleatória qualquer. 

(a) Mostre que yy(t)= E costX + i E sen tX. 

(b) Mostre que y- y (t) = E cos tX — i E sen tX. 

(c) Mostre que y- x (f)  ex(- t). 

Seja X uma variável aleatória simétrica, isto é, tal que X e — X têm a mesma 
função de distribuição. 

(a) Mostre que E sen tX = 0 e que yy(t) é real. 

(b) Mostre que ey(—1) = ey(t). 


. Sejam X e Y variáveis aleatórias independentes e identicamente distribuídas. 


Mostre que ey у(ї)=|фу(ї)|?. Sugestão: use o Exercício 15. 

Seja X uma variável aleatória tal que vy (f) é real. 

(a) Mostre que X e —X têm a'mesma função característica (use o Exercício 
15) 

(b) Por que se segue que X e —X têm a mesma função de distribuição? 


. Seja X uma variável aleatória contínua tendo a densidade fy(x) = 


=(1/De 1X! , —°<х < oe, 


(a) Mostre que ex(£) = 1/(1 * t? ). 
(b) Use (a) e a fórmula de inversáo (19) para concluir que 


E un 1 
е pj -— | p — == dt 
– о n(l + t^) 


(c) Mostre usando (b) que 


Et = | NA d. i 
-o л(1 + E) 


Seja X uma variável aleatória tendo a densidade de Cauchy 


1 


—B4 —0 « x < 00. 
л(1 + x^) 


fx(X) 


Ш 


Mostre que yy(t) —e^l*l, —ee« t œ, Sugestão: inverta as funções de 
x e t no Exercício 19. 


. Sejam X e Y variáveis aleatórias independentes tendo a densidade de Cauchy. 


(a) Obtenha as funções características de X + Y e de (X + Y)/2. 
(b) Por que se segue que (X * Y)/2 também tem a densidade de Cauchy? 


ЭО. == тошу EI NEN IGI Uum. ше ы sem | 


22. Estenda o resultado do Exercício 21 mostrando que se X,, X,,...,X, são 
variáveis aleatórias independentes, cada uma com densidade de Cauchy, então 
(X4 *---* X,)/n também tem a densidade de Cauchy. 

23. Para А > O seja Ху uma variável aleatória tendo distribuição de Poisson 
de parâmetro А. 


4 (a) Usando argumentos semelhantes àqueles usados na demonstração do Teo- 
rema do Limite Central mostre que para —9e < t < оо, 


lim Eg*X^-2/*^ = lim exp [AeA -1 — ПАЙ =. gm 


A>00 ТА 00 


р (b) Que conclusão se deve tirar de (a), através de uma modificação adequada 
do Teorema da Continuidade? 


CAMINHOS ALEATÓRIOS 
E PROCESSOS DE POISSON 


Neste capítulo discutimos dois exemplos elementares porém importantes 
de processos estocásticos. Um processo estocástico pode ser definido como qualquer 
coleção de variáveis aleatórias. Geralmente, entretanto, quando nos referimos a um 
processo estocástico temos em mente um processo que possua estrutura adicional 
suficiente para que resultados interessantes e úteis possam ser derivados. Isto certa- 
mente é verdade para os dois exemplos tratados neste capítulo. O material sobre 
processos de Poisson, nosso segundo exemplo, náó depende das duas primeiras 
seções onde discutimos caminhos aleatórios. 


9.1. CAMINHOS ALEATÓRIOS 


Considere uma sequência de jogos tal que, durante o n-ésimo jogo, observa-se 
uma variável aleatória X, e qualquer jogador participando do n-ésimo jogo, 
recebe a importância X, da “banca” (naturalmente o jogador paga na realidade 
— Xn àbancase X, < 0). 

Acompanhemos o processo de um jogador que começa com um capital inicial 
x. Seja S,,n Z 0, oseu capital após п jogos. Então $9 =x e 


Sn —XtX te tXm nz]. 


A coleção de variáveis aleatórias So, S4, $52, ... é um exemplo de um processo 
estocástico. Para obter resultados interessantes admitiremos a hipótese de que as 
variáveis aleatórias X,, X,,... são independentes e identicamente distribuídas. 
Sob essa hipótese o processo So, $1,... chama-se caminho aleatório. 

Admitiremos a hipótese adicional de que os Xy têm média finita и. Se 
um jogador participa dos n primeiros jogos, seu capital esperado no momento 
da conclusão do n-ésimo jogo é 


(1) ES,-—x*ny. 


Suponha entretanto que o jogador escolha os números a & x e b> x e assuma 
consigo o compromisso de abandonar o jogo quando seu capital se tornar nào maior 
que a ou não menor que b. Então o número T de vezes que ele joga é uma va- | 
riável aleatória definida рог | 


T - min(n20|$, <a ou 5, >b). | 


WV 
Para garantir que Sn <a ou 5, >b para algum n, admitimos que | 
(2) P(X = 0) < 1. 
É possível demonstrar que a variável aleatória T é finita (com probabilidade 1) € 
e na realidade P(T > n) decresce exponencialmente à medida que n > oe. Isto 
significa que existem constantes positivas M e c« 1 tais que 
(3) PCT ny Met n=O, l 2». 
A demonstração de (3) não é difícil mas será omitida para reservar espaço para 
resultados de interesse muito maior. De (3) e do Teorema 5 do Capítulo 4, segue-se 
que ET e todos os momentos de ordem superior de T são finitos. 
Se o jogador abandona o jogo após a T-ésima aposta, seu capital será ST 
(ver Figura 1). Uma famosa identidade devida a Abraham Wald relaciona o capital 
esperando, quando o jogador abandona o jogo, com o número esperado 
e 
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O шө EEE ТТ:-( Т Т-+ + к 


de vezes que ele participa do jogo. Especificamente, a identidade de Wald estabe- 
lece que 


(4) ESp =x + ЏЕТ. 


A identidade de Wald é extraordinariamente semelhante a (1). 

É conveniente introduzir uma nova notação para demonstrar a identidade 
de Wald. Seja А um evento qualquer. Representaremos por 14 a variável aleatória 
indicadora de А, isto é, a variável aleatória que é 1 se А ocorree, Ose А não 
ocorre. Por definição 14 + 14с = 1. Usando esta notação podemos escrever 


T © 
S1 = х + У КЕ ғ Y X т> 
= j= 


i j 
J 
Uma vez que o complemento do evento ( T >j ) é o evento {T <j}, vemos que 


(5) ST = х + 2 Х 1 E (т<), 
j= 
e portanto 


(6) ЕЅт = х + Е У ХАІ — Цт<д). 
= 


Pode-se mostrar usando a teoria da media que a ordem de expectância e somatório 
pode ser invertida em (6). Assim 


(7) ES, = х + X E[X 41 — т<]. 
FEX 

Para determinar se T «7, não basta olhar as variáveis aleatórias X;, X5, ... , Xj. 1. 
Segue-se que as variáveis aleatórias X; e (1 — [т< д) são independentes. Conse- 
quentemente 

Е[Х (1 — 1т<3)] = ЕХ,Е(1 — т<) 
ul — MT < j) 
uT > j) 


<a Concluímos de (6) e do Teorema 5 do Capítulo 4 que 


ES, x- à Y, MT >)) 
ji 


Ex 4+ ШЕТ, 
que completa a demonstração da identidade de Wald. 
Se os X, têm média и = 0 e variância finita o?, existe uma segunda 
identidade devida, a Wald, a saber 
(8) Var Sr = o?ET. 


Como EST = х ет (4), a fórmula (8) é equivalente a 
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(9) Ет x) = о?ЕТ. 
А seguir verificaremos (9). De acordo сот (5) 
$т— x= К. ХК1 — т<). 
E 
e portanto 


— 
Ei. 


(S? — xy = Y X(1 1га) X, Xd — 1ге) 
= k 


I 
м 
E 
Lo: 


— lgz5)XX0 — Loc). 


Para tomar as expectâncias é novamente permissível inverter expectância e somatório. 
Concluímos que 


(10) ES, — x) = 1 рУ EX cU NE IU. 
fA 


Avaliaremos a seguir os termos individuais deste somatório duplo. Considere inicial- 
mente os termos correspondentes a valores de j e k tais que j< k. A variável 
aleatória 


Xj(1- 1т<3Хі — lirc) 
depende somente de X,, X2, - - -, Xk-1. e portanto, é independente da variável 
aleatória Хр. Como EX, = u = 0, vemos que 
E[X {1 E lir< 5)X« e 1т<к})] 
ED E[X {1 — т<! — lir«)]EX, = 0. 


Analogamente os termos do segundo membro de (10) desaparecem quando j > К. 
Quando j= К obtemos 


Е[Х А1 P Боз [| 


A variável aleatória (1 — 1;7-5) depende somente de Ху, X2, .. ., Ху, e 
portanto é independente de X;. Como esta variável aleatória assume apenas os 
valores О e 1, vemos que 
Q= т)? = т<) 
Assim 
Е[ХҚ1 — l<] = E[Xj( — Ir] 


ЕХ РЕ — o) 


Var X;(1 — P(T < j) 


a P(T > ј). 


4. à 


Concluímos de (10) e do Teorema 5 do Capítulo 4 que 
ES =» =" P(T mj) mE, 
j=1 


o que demonstra (9) e portanto (8). 


"0 Е 
9.2. CAMINHOS ALEATORIOS SIMPLES 
Admitiremos ao longo de toda esta seção que a Sx < 2, a« b eque a, b 
e x são inteiros. Pode-se aplicar mais facilmente as identidades da seção anterior 
se sabemos que 
A 


(11) Р(8т=а ou b) 2P(Sp—-a)* P(SrT—-b)- 1. 

Este certamente será o caso de 

(12) P(Xy ——1,0, ou 1)» 1, 

e neste caso o caminho aleatório So, S1, ... chama-se caminho aleatório simples. 


A propriedade principal que distingue caminhos aleatórios simples de outros ca- 
minhos aleatórios é que eles não dão “saltos sobre" pontos inteiros. Sejam 


p= Р. = |}, 
ФЕР P(X, = zu 
Т = РАО 


Então p > 0, q20,r20ep*q*r- 1. A hipótese (2) estabelece que г< 1. 
Segue-se de (11) que 

(13) ESr = aP(S, = а) + bDP(Sq = Б) 

a(l — Р(5т = b)) + ЬР(5т = b). 


Para caminhos aleatórios simples podemos resolver explicitamente para 
cm P(Sr = а), Р($т = b), ESr e ET. Considere inicialmente o caso р =q. Então 
u= 0 е а identidade de Wald (4) se transforma em EST =x. Assim como (13) 


x -a(1— P(Sq — b)) * BP(Sq = b). 


Segue-se imediatamente que 


(14) P(Sr=b)= 5—5 
e 

b-x 
(15) Pres 
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A identidade de Wald não dá informação alguma sobre ЕТ quando и = 0. 
A identidade (8) é aplicável neste caso e obtemos que o? =р+4= 1-ге 


Var 5; = о?ЕТ = (1 — r)ET. 


Mas 
Var 5; = ES? — (ES) 
= БЬ?Р($5т = b) + а?Р(5; = а) — х? 
_ P(x-a)ta(b-x) _ E 
b—a 
= (ax + bx — ab) - x? 
= (х — ayb — x). 
Assim se p — q, 
06 С A ens 26 xm 
Sa 
Serc0speq- 1/2, 
(17) ET = (x ~ aY(b — х). 


Exemplo 1. Dois jogadores tendo capitais iniciais de $5 e $10, respectivamente, 
concordam em fazer uma série de apostas até a ruína de um deles. Suponha que os 
resultados das apostas são independentes e que ambos os jogadores têm probabilidade 
1/2 de ganhar qualquer aposta. Determine a probabilidade de que ocorra a ruína 
do jogador cujo capital inicial é $10. Determine o número esperado de apostas. 

O problema se encaixa no nosso esquema com 5, representando o capital 
do jogador menos rico, ao cabo de n apostas, se escolhemos р = q = 1/2, x = 5, 
а= 0, е b = 15. A resposta da primeira parte é 


A resposta da segunda parte é 
ЕТ = (5 — 0)(15 — 5) = 50. 


Suponha a seguir que р q. Para evitar exceções triviais admitiremos que 
р> 0 е а> 0. A identidade de Wald nào pode ser usada para obter Р($т = b) 
se pq; portanto necessitamos de outra abordagem. 

Defina f(x) para x inteiro em [a, b] fazendo f(x) representar a proba- 
bilidade de Sr = b quando S, = x. Observamos inicialmente que f satisfaz a 
equação de diferenças finitas 


(18) 16) = ра т) xs b. 
Isto é verdade porque 


f(x) = P(Sr = b) 


=p Р(5: = Р| Лү = 1) +g MS; = Ь| Х, = —1) 
+ к Р(57 = b| X, = 0) 
е 
P(S;-b|X,-i)-f(x-^i) i-21,-L0 
Além de (18) temos as óbvias condições de contorno 
(19) Jw)0 еру 
De(18)e (1— r) =р + q, vemos que 
(20) fo*)-fe)- F-E- a<x<b 


Seja c = f(a + 1) = f(a + 1) — f(a). Então (20) implica que 
fee = убу (y. а<х<Ь. 
р! 


Usando a fórmula da soma de uma progressão geométrica obtemos 


уо) = Јо) – Ја) = Y, GG * 0 - f» 


zcb с. 
1 — (4/р) 


Do caso especial f(b) — 1, temos agora que 


RT 77 NN 
1 — (q/p)?-* 


Substituindo este resultado na expressão de f(x), obtemos 


| =p ^4 


O= гарра" 
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Em outras palavras, mostramos que se pq e р>0, então 


1 — p — % 


Q1) dor ED 


а= х= а. 


Segue-se imediatamente de (21) que sob as mesmas condições 


xp aa 


22 Р(5т = а ; <х<Ь 
ж, Oran 1 — (a/p)? -° 
De (13) e (21) 
Lan Ее 
23 ESTE Ра) а 
Y шыже 
Como и=р— q, segue-se agora da identidade de Wald que 
(24) pr.= (bs Dm ктш a<x<b 
p — 4/ 1 — (alp) p—4 


Exemplo 2. Modifiquemos o exemplo anterior supondo que o jogador mais rico, 
em virtude de sua maior habilidade, tem probabilidade 0,6 de ganhar uma aposta 
qualquer, com o outro jogador tendo probabilidade 0,4 de ganhar a aposta. Deter- 
mine a probabilidade de que ocorra a ruína ao jogador mais rico, o ganho esperado 
deste jogador e o número esperado de apostas. 

Para este caso tomamos p = 0,4 e q = 0,6. A probabilidade de que ocorra 
a ruína do jogador mais rico é 


= (0,6/0,4)° 


idum г 


= 0,0151. 
Рага obter o ganho esperado do jogador mais rico observamos inicialmente que o 
capital esperado do jogador mais pobre ao final do jogo é 


ES т = 15P(Sq = 15) = 15(0,0151) = 0,23. 


Assim o ganho esperado do jogador mais rico ou a perda esperada do jogador mais 
pobre é $5,00 — $0,23 — $4,77, uma boa percentagem do capital inicial do joga- 
dor mais pobre. O nümero esperado de apostas é 


ESp-x -AM 
-————- x 24. 


ET т 05 


» 


т —— amy 7 >. 


m 


EI 


———À 


Suponha que b > œ em (21). Pode-se mostrar que o primeiro membro de 
(21) converge para P(S, > a para todo n > 0). Se q <р, o segundo membro 
de (21) converge para 1 — (q/p)* ^". Se q >p, o segundo membro de (21) con- 
verge para O. Se q = p, o segundo membro de (14) converge para O. Assim para 
а<х= 80, 


kt q 278 
(25) P(S, > a para todo n > 0) = | (5) para q « p, 
0 para д> p. 

De forma semelhante рага b > x = So 

В-х 

1 — ( para p « q, 
P(S, « b paratodo n > 0) = q 

0 para p 2 q. 


Exemplo 3. Um cassino tem um capital de cem mil dólares. Um jogador infinita- 
mente rico tenta quebrar o cassino. Uma vez aceito seu desafio, ele decide apostar 
$1000 de cada vez. Se o jogador tem probabilidade 0,49 de ganhar cada aposta e 
0,51 de perder, qual é a probabilidade de que ele consiga quebrar a casa? 

Seja S, o capital do cassino (em múltiplos de $1000) após n jogos. Então 
р = 0,51, q = 0,49, x = 100 e 4 = 0. De acordo com (25) a probabilidade de 
que ocorra a ruína do cassino é 

0,49 


AE 100 
1 — Р(5, 70 para todo n>0)= d = | = 0,018. 
р 0,51 


Seja A um subconjunto dos inteiros (nas aplicações 4 terá 0, 1, ou 2 pontos). 
Para x € A e y É A, seja PA(x,y) a probabilidade de que um caminho aleatório 
simples partindo de x alcance y em algum tempo positivo antes de alcangar A. 
Para x € А ou y € A, seja PA(x, y) = 0. Estas probabilidades podem ser deter- 
minadas em termos das fórmulas desta seção. 
Exemplo 4. Suponha que p = д. Determine Р 4,» (y, y), onde a <y € b. 

Depois de um passo, o caminho aleatório está em у — 1, y, ou y + 1 com 
probabilidades p, 1 — 2p e p, respectivamente. De y — 1, a probabilidade 
de retornar а y antes de alcançar а é (y — a — 1)/(у — a). De y + 1, a proba- 
bilidade de retornar a y antes de alcançar b é (b — y — 1)/(b — y). Assim a 
probabilidade de retornar a y antes de alcançar a ou b é dada por 


—a-—i Бр. 1 
Рыб уйл pt == + 1 UI split IS 
ou 
b — a) 
(26) Pa. (у, y) = 1 – ДИР = а 
ys (у - aXb — y) 
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Para x € А е y А, seja Сд(х, у) o número esperado de visitas а у 
(para valores positivos de п) antes de atingir А para um caminho aleatório come- 
cando em x. Seja Сд (х,у) = 0 se x € А ou y € A. Não é difícil mostrar que 
o nümero de retornos de y a y, antes de atingir А, tem distribuição geométrica 
de parâmetro p = 1 — Рд (у, y). Assim pelo Exemplo 3 do Capítulo 4, 


Рд (у, y 
(27) СА(у,у)= элу) . 


Se x y, então 
(28) GA (x, y) =Рд (х,у)(1 + G4 (у, у)). 
Pois para ter qualquer nümero positivo de visitas a y antes de atingir А, devemos 
primeiro chegar a y antes de atingir А. 

Isto ocorre com probabilidade Рд (х, у). Se chegamos a y, o número total 
de visitas a y antes de alcançar А é 1 mais o número total de retornos de y a y 
antes de alcançar А. Isto explica (28). De (27) e (28) temos que 


Р(х, 
(29) саб) = T 


Exemplo 5. Retornemos ao primeiro exemplo desta seção. Determine o número 
esperado de vezes п > 1 que os dois jogadores retornam aos seus capitais iniciais 
antes que ocorra a ruína de um deles. 

Lembramos que neste exemplo р = q = 1/2, а = 0, x 5e b = 15. A proba- 
bilidade de retornar aos capitais originais antes que ocorra a ruína de um deles é, 
de acordo com (26), 


para todo x e y. 


(1/2)(15) 
зе Ө 
Assim de acordo com (27) o nümero esperado de vezes que ambos os jogadores 


Р ‚15 (5,5)= 1 — = 0,85. 


P ois (5, 5) 
1— P 015 (5, 5) 


ECC 34 
— 1 = 597. 


G ois (5,5) = 


9.3. CONSTRUÇÃO DE UM PROCESSO DE POISSON 


Nas seções restantes deste capítulo consideraremos um modelo probabilístico 
para a distribuição aleatória de partículas no espaço ou eventos no tempo. Tais 
modelos encontram aplicações em uma variedade de campos diferentes. Como um 
exemplo, suponha que temos uma porção de uma substância radioativa e suponha 
que um experimento consiste em observar os tempos em que ocorrem as desintegra- 
ções. Suponha que o experimento começa no tempo O e seja Dm o tempo da 


«› 


= —— — 


m-ésima desintegração. Como foi discutido no Exemplo 2 do Capítulo 1, as leis 


da física nos diz que os tempos Dm devem ser considerados variáveis aleatórias. 


A coleção de pontos Di, D;,... pode ser considerada como um subconjunto 
aleatório enumerável de [0, о). 

Como outra ilustração de um fenômeno que é essencialmente o mesmo, consi- 
dere as chamadas chegando a uma central telefônica. Seja Dm o tempo em que 
inicia a m-ésima chamada. Não se conhece nenhuma forma de prever Dm com 
exatidão, mas elas podem ser tratadas como variáveis aleatórias para obtenção de 
resultados úteis. 

Considere um experimento do seguinte tipo. Introduz-se um bastão em um 
tubo contendo uma suspensão de bactérias. A seguir esfrega-se o bastão unifor- 
memente sobre a superfície de um disco contendo nutrientes através dos quais as 
bactérias podem se multiplicar. Após alguns dias aparece uma colônia visível de 
bactérias em cada lugar onde foi depositada uma bactéria. A localização destes 
pontos bem como o seu número total são aleatórios. A Figura 2 ilustra esta situação. 


Figura 2 


A localização dos pontos pode ser vista como. um subconjunto aleatório dos pontos 
do disco. 

Nos exemplos de partículas radioativas e bactérias fomos levados a considerar 
uma coleção aleatória de pontos em um certo subconjunto $ do espaço Euclidiano. 
Nestes exemplos, tanto a localização das “partículas” como seu número total são 
aleatórios. Associadas a uma coleção aleatória deste tipo existem diversas variá- 
veis aleatórias tais como o número total N de partículas em $, o número de par- 
tículas Np ет um dado subconjunto В С 5 еа distância Dm de um dado ponto 
em S até a m-ésima partícula mais próxima. Na Figura 3 as partículas são represen- 
tadas por pontos. Nesta figura № = No = 4 e N в = 2. Estudaremos as distribuições 
e as distribuições conjuntas de variáveis aleatórias como estas no restante deste 
capítulo. 

Existem naturalmente inúmeros modelos matemáticos diferentes que consi- 
deram a distribuição aleatória de partículas. Consideremos um dos mais elemen- 
tares e mais importantes de tais modelos, chamado processo de Poisson. Tal processo 
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está intimamente relacionado com a distribuição uniforme de partículas que será 
considerada inicialmente. 


Figura 3 


Considere então um sistema em que o número total de partículas n é fixo, 
mas para o qual: as localizações das partículas em 5 são aleatórias. O modelo que 
desejamos é tal que estas n partículas se distribuem independente e uniformemente 
sobre o conjunto 5 tendo volume finito. Seja | В | o volume de B. Então cada 


partícula tem probabilidade p — | B |/| S | de cair em B. Conseqüentemente o 
número de partículas Ng que caem em В tem distribuição binomial de parámetros 
n e p. De uma forma mais geral, sejam В,,В,,...,Врк, k subconjuntos disjuntos 
de S cuja união é S e seja p; = | B; 1/15 |. Então as variáveis aleatórias 
NB, ...,Npg, tem distribuição multinomial de parâmetros n e р;,...,рк. 
Portanto se n;,,...,"& são números inteiros não-negativos de soma n, 
n! "s x 
Р(М», = ny...» №, = n) = 3 Pi Pk 
(m) (m! 
ГЕ nj 
n! П |B j| j 
[5 |" jzi n;! 


O processo de Poisson em 5 resulta de uma modificação do sistema acima. 
Supomos agora que o número total de partículas № = №5 ет 5, é uma variável 
aleatória tendo uma distribuição de Poisson de parâmetro А | S |. Além do mais 
admitimos que dado N = п, as partículas se distribuem independente e uniforme- 
mente sobre S. Considere os subconjuntos B,,...,By definidos anteriormente. 
Nossas hipóteses são de que se 7,,...,n,& são k números inteiros não-negativos 
de soma n, então 


| ) nt £s BP 
РОМУ = SN. тр МЕ пу = o, 
( 5 a P a IS|" j=1 nj! 


Portanto 


S [^5 
(30) P(N = n, Ny, = т,..., Ng, m n) = PON = п) E [ү 181" 
[5 |" ј=1 nj! 


п! ISl у= nj! 
= Ате А151 ІВ" 
ј=1 n;! 


Como os conjuntos B; são disjuntos e sua união é S, 
Lo Esse oer Dg 


de modo que o segundo membro de (30) pode ser escrito como 
х (A|B;D"" e Bil, 
yet Un 


О evento(.N = n, Np, —n,,...,Ngy —ny]é o mesmo que o evento (Ng, 
—n,...,Npgy —ny) porque m= ti t: tng e М = №, docct pis 
Portanto 


PON = mn, Ng. = «Мв ong) PINA, —n,...,Npgy = ny). 


Acabamos assim de demonstrar um importante fato: 


k (4|B;" 
(31) P(N, = ns Ng, = t) = (41BjD" о-ви 
j=1 nj! 
Em outras palavras, as variáveis aleatórias N B,» Np, são independentes e 


têm distribuições de Poisson de parámetros № |В; |,...,X| By |, respectivamente. 

Não é muito surpreendente que as variáveis aleatórias N Bj 15 js Kk 
tenham distribuições de Poisson; mas é surpreendente que sejam mutuamente inde- 
pendentes porque no caso em que o número de partículas é fixo, as quantidades 
correspondentes são dependentes. É esta propriedade de independência que torna 
fácil o manuseio do processo de Poisson em aplicações. 

Nos modelos acima, o número total de partículas, fosse ele fixo ou aleatório, 
era sempre finito, e as partículas se distribuíam sobre conjuntos tendo volume total 
finito. Entretanto para certas finalidades é teoricamente mais simples considerar 
um número infinito de partículas distribuídas sobre um conjunto tendo volume 
infinito. Assim poderíamos desejar que as" partículas se distribuíssem sobre todo 
R” ou todo [0, œ) etc. Para cobrir tais casos, necessitamos apenas introduzir uma 
pequena extensão no modelo anterior. 

A hipótese básica de um processo de Poisson sobre um conjunto S tendo 
volume finito ou infinito é que se B,,...,Bk são subconjuntos disjuntos de S 


ә 
ә 


|; 


tendo volumes finitos, as variáveis aleatórias М В.5 == »NBk são independentes 
e têm distribuições de Poisson de parámetros X | B, |, А | Ву ho Fespeetiva- 
mente. А constante À chama-se parámetro do processo di Potete: 

Seja В um subconjunto de 5 tendo volume finito. Como uma conseqüéncia 
da definição de processo de Poisson, segue-se que se B,, В,,... „Вр são sub- 
conjuntos de B cuja união é B e л;, п, ..., пр são números inteiros não- 
negativos cuja soma é n, então 


(32) P(Ng, = ny...» Ng 


=н Ne = Ee 
Е ier Ц n;! 


Para verificar (32) observe que a probabilidade desejada é simplesmente 


P(Ns, = ny... Ng, = n) _ [i-:6 (В) 
P(N, — n) e ^181 (2| B|y'[n! 


que se reduz ao segundo membro de (32). 

Outra interpretação de (32) é a seguinte: Dado que existem n partículas 
em B, a distribuição conjunta das variáveis aleatórias NB, ...,Npgy éamesma 
que se obtém distribuindo п partículas independente e uniformemente sobre B. 
Este fato é muito útil na resolução de alguns problemas em que o processo de Poisson 
atua como entrada de um sistema mais complicado. Não entraremos em maiores 
detalhes deste aspecto do processo de Poisson no presente texto. (Veja entretanto 
os Exercícios 21 e 31 para ilustração de seus usos.) 


9.4. DISTÂNCIA ÀS PARTÍCULAS 


Suponha que temos um processo de Poisson sobre um subconjunto 5 do. 
espaço Euclidiano. Se 5 tem volume finito, o número № de partículas em 5 
é finito. Sejam D, < D; <...< Ру as distâncias da origem às partículas, orde- 
nadas em ordem não-decrescente. Se $ tem volume infinito, o número de partículas 
em S é infinito e representamos por D, < D; <..-.<D, --- as distâncias da 


„origem às partículas, ordenadas em ordem não-decrescente. Tal arranjo é possível 
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porque, para qualquer número positivo r, apenas um número finito de partículas 
estão a uma distância menor-que 7 da origem. Nesta seção obteremos a distribuição 
de Dm para diferentes escolhas do conjunto S. 

Daremos inicialmente um exemplo em que essas distâncias ocorrem trad: 
mente: suponha que as estrelas situadas em um certo conjunto $ do espaço Eucli- 
diano tridimensional se distribuem de acordo com um processo de Poisson sobre 55 
com parâmetro A. Suponha além do mais que essas estrelas tem igual brilho. A 
quantidade de luz de uma estrela que chega à origem, é proporcional ao inverso do 
quadrado da distância da origem' à estrela. Assim a quantidade de luz recebida de 


uma estrela a uma distância r da origem é K/r? para alguma constante К. A quan- 
tidade de luz recebida da estrela mais próxima (e portanto aparentemente mais 
brilhante) é К/О. A quantidade total de luz é 


Y K 

bs 

Através de técnicas avançadas de probabilidade pode-se mostrar que se 5 é todo 
o espaço tridimensional, a soma da série acima é infinita com probabilidade 1. Este 
fato tem interessantes implicações em cosmologia. 

Determinaremos agora a distribuição de Dm supondo por simplicidade 
que 5 tem volume infinito. Seja $,— $1 x:|x|<r (istoé,seja S, o conjunto 
de pontos em S que estão a uma distância não superior a 7 da origem), e seja 
y(r) o volume de 5,. O número Ns, de partículas em S, tem uma distribuição 
de Poisson de parâmetro Ay (r). O evento {Dm < r ) é mesmo o que o evento 
(Ns, >m}. Assim pelas Equações (39) e (40) do Capítulo 5 


(33) P(D, € ғ) = P(N, > m) 


Аф(г) n1 —t 
| E “dt 

о (m — 1)! 

Segue-se de (33) que se y(r) é diferenciável, então Dm tem função de densidade 
fm dada por 


гў Pp tre tm 
(34) fr) = rupe MESS. 


Se y(r) é estritamente crescente, tem uma função inversa contínua q^! (r). Segue- 
se de (33) que а variável aleatória (Dm) tem a distribuição gama Г(т, A). 

Em inúmeros casos importantes y(r) é da forma y(r) = cri, onde c é 
uma constante numérica (isto é verdade, por exemplo, se 5 =R? ou se 
S = [0,929)). Neste caso (34) se transforma em 


WcAY жаса сн” 


(35) fá”) = ————r e : т> 0. 
т — 


Diversos casos especiais desta fórmula serão considerados nos exercícios. 
Usaremos a Fórmula (35) para determinar os momentos ED], nestes casos. 
Assim 


pæ 


ЕР}, rif (ғ) dr 


ll 


v 


Jo (m — 1)! 
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Para determinar estes momentos, fazemos a mudança de variável s = Acr e inte- 
gramos para obter 


(2с) ""T(m + Gd). 


ED = 
(m — 1)! 


9.5. TEMPOS DE ESPERA 


Até este ponto visualizamos um processo de Poisson como um modelo para 
a distribuição de partículas no espaço. Se pensarmos no conjunto [0, œ) como 
sendo o eixo dos tempos, podemos considerar um processo de Poisson em [0, оо) 
como a distribuição de tempos em que ocorrem certos eventos. No começo da 
Seção 3, mencionamos alguns exemplos do uso de um processo de Poisson em 
[0, o) desta maneira. Quando passamos a pensar em um processo de Poisson 
em [0, œ), сото a distribuição de eventos no tempo e não mais como a distri- 
buição de partículas no espaço, introduzimos um novo conjunto de termos. Em 
vez de falar de “partículas”, passamos a falar de “eventos”, e a distância Dm da 
origem à т-ёѕіта partícula se transforma em tempo de ocorrência do m-ésimo 
evento. 

Seja N(t) = №о, гу O número de eventos que ocorrem no intervalo de 
tempo [0, t]. Então N(t) é uma variável aleatória com distribuição de Poisson 
de parâmetro At. Se 0<s<t, N(t) — N(s) é o número de eventos que ocorre 
no intervalo de tempo (s, t], e tem uma distribuição de Poisson de parâmetro 
A(t — s). De uma forma mais geral, se O < f; < ft; <---<t,, então N(t,), 
№) — №) ,... , N(t4) — N(t4 |) são variáveis aleatórias independentes 
que têm distribuições de Poisson de parâmetros 


Ма Mis =з. „АС Ls) 


respectivamente. Estes fatos são decorréncias imediatas da definição do processo 
de Poisson e sua descricáo em linguagem de tempo. 

Como foi mencionado acima, D,, é o tempo do m-ésimo evento. Sabemos 
dos resultados da Seção 9.4 que Dm tem distribuição gama T(m, №). Em parti- 
cular D, se distribui exponencialmente com parámetro А. Lembre-se do Capítulo 6 
que a soma de m variáveis aleatórias independentes identicamente distribuídas 
com distribuição exponencial têm a distribuição gama T(m, A). Suponha que 


se define as variáveis aleatórias Wi,W>,...,W,,... da seguinte forma: №; = 
= р,, Wn =D, – D,-1, n Z2. Então claramente Dm = W; *t---* Wm. A 
discussão acima torna plausível que Wi, №, ..., №. sejam variáveis aleatórias 


independentes exponencialmente distribuídas com parâmetro comum A. Este 
fato é verdadeiro, sendo uma propriedade bastante interessante e útil do processo 
de Poisson em [0, œ). Naturalmente a variável aleatória W não é nada mais 


m" 


a ———————————————R 


que o tempo entre o (т — 1)-ésimo e o m-ésimo eventos, de modo que os tempos 


Wi, W2, . . . são tempos de espera entre eventos sucessivos de um processo de 
Poisson. 
Teorema 1. Sejam Wi, И, ..., Ип, ... os tempos de espera entre eventos 


sucessivos de um processo de Poisson em [0, о) de parâmetro A. Então 
Ил, п > 1, são variáveis aleatórias mutuamente independentes, exponencial- 
mente distribuídas, como média comum А!. 


Demonstração. Seja f, a densidade n-dimensional dada por 


sa ue A € Жатат жар unge 
D eM 0, para outros valores de /1,... , fg. 


Vemos do Exemplo 13 do Capítulo 6 que o teorema é verdadeiro se, e somente se, 
as variáveis aleatórias D,,...,Dy têm densidade conjunta fn. Isto é verdadeiro 
para п = 1 uma vez que D, se distribui exponencialmente com parâmetro A. 
Uma demonstração geral rigorosa é mais complicada. Antes de apresentá-la, 
daremos uma forma heurística de constatar este fato. 
Seja 0 = to < <---<tņn e suponha que se escolhe h > 0 suficientemente 
pequeno para que t; , th<t;, i— 1, 2,...,n. Então (ver Figura 4) 


= P(N(t) = 0, N(t + h) — N(tj)) = 1,.:., 
N) — №, + h) 20, N(t, + h) — N(t) > 1) 
= e ^(Ah)e ^ TOM g M вае TE ge 


= КЫШ, тос "s e), 


(36) PG < D SE Ee т) 


0 1 0 1 0 


ССЭ cl 
t th t trth ts 
Figura 4 
Se soubéssemos que as variáveis aleatórias Dı, D,,...,Dy têm uma densidade 
conjunta gn que é contínua no ponto (fi, f2,. . . , tn), poderíamos concluir 
que 


P(t;<D;<t;th para I<i<n)=gn(t,...,tn)h" telh), 


onde e(h) é alguma função de h tal que 


Seguir-se-ia então de (36) que 
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g(t; ...st) = hm "PG, < D, € t; + h) 
h 10 


cj гл = ——_ 
h 10 h 
с. A e n 
como desejávamos. 

Daremos agora uma demonstração elementar porém rigorosa do Teorema 1. 
Embora esta demonstração não seja difícil, é um tanto longa, e o leitor poderá 
omiti-la se assim o desejar. 

Seja F, a função de distribuição que tem densidade f,. Da definição de 


Integrando ambos os membros sobre o conjunto 5; € £1. .... Sn Stn. vemos que 
11 
б) в) ЛЕО з Si) de. 


Seja Gy а distribuição conjunta de D4,,D5,...,D,. Do Exemplo 10 do Capítulo 
6 vemos que o teorema é verdadeiro se, e somente se, as variáveis aleatórias 
Dı, ..., Dn têm densidade conjunta fn, e portanto a função de distribuição 
conjunta F,. Conseqüentemente para demonstrar o teorema devemos mostrar 
que Fn = С. 

Mas F, é simplesmente a distribuição exponencial de parámetro А. Como 
foi observado anteriormente, G, a distribuição de D,, é também exponencial 
de parámetro À. Portanto Р, = С;. 

Suponha que podemos mostrar que para п 22, 


(38) Gti -cs h) = MIOONO = 51,...5 f, — S4) йз. 


Jo 
Então como F, = G,, seguir-se-ia de (37) e (38) que С, = F,. Usando o fato 
de que С, = Fz, outra aplicação de (37) e (38) mostraria que G4 = Ёз etc. Em 
outras palavras, se soubéssemos que (38) é válido, o teorema seguir-se-ia de (37) 
e (38) por indução. Para estabelecer (38) podemos supor que O < t; € --- &f,, 
pois em caso contrário ambos os membros de (38) são zero. 
Para iniciar a demonstração, observe que o evento D;<t; é o mesmo que 
oevento N(t;)>i е assim 


{0,<1,1<і<п) = (|р < 2) 
i=1 


П N) > i} 


i=1 


NG x тт п). 


Podemos, portanto, escrever 
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n) 


Gti taes bh) Р(М( к=, е 0). 
Conseqüentemente (38) é o mesmo que 
(39) PNE 1 usen) 


= | (5 )Р(М( — s)zi-1l,2<i<n)ds. 
0 


s Para estabelecer (39) observe inicialmente que para qualquer k> 1 
(40) шу et = | Ae ^ [д — зур ge 79 ds. 
k! (k — 1)! 
De fato, 
| ү jg is UC — 9] 7 orae» ds E |, (= srt 
> 0 (k — 1)! - 1 
= EA r s ds = (20) go 
(k — 1)! Jo k! 


Suponha que 0 € t, & £j &--- €t, eque 1 &K, <k <---<kpn. Alegamos 
a seguir que 


(41) PING) = ko... NOU = у 
= | а-ар, = m kp doctis Re DA 
Para verificar este fato, observe que de acordo com (40) 
(42) PON). = s sao МО) = E) 
=P(N(t) = k) П PULS сл E) 


$ f Де? Га, — s]^ 71709-9 ds 
б (Буз 
» П [tc ыы па M 
j= (k; = k;-1)! 


Por outro lado 
(43) Г Ae “Р(М(ї, — 5) = К, = 1... N(t, — 5) = К, — 1) ds 
= [ Ai POR OR ede. 
* Ц P(N(t; — s) — N(tj-., — s) = k; — Ку-у) ds 


- jouit T Ret] eta ood 
9 (к, — 1)! 
тү ГАС — ED podido Ли. 


х 
H [Ej — Ke)! 


S. 
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Comparando o segundo membro de (42) com o de (43), vemos que (41) é verda- 
deiro. A igualdade desejada (39) segue-se então de (41) pela soma de ambos os 
membros de (41) sobre todos os valores de К,,...,К„ taisque А, <, <---<K,, 
е 21. 5 22,1, Бухта: 


Exercícios 
1. Seja S, um caminho aleatório com 4 — 0 e Sọ =x. Suponha que 
Р(а-с<8т<Ь+а) = 1, 


onde a<x<b, cz0e d>0. 


(a) Mostre que 


(a — JP(Sy € a) + bP(S, > b) 


€ x € aP(S, < a) + (b + d)P(S, > Б). 
(b) Mostre que 


Rã du <P» ns cm 


PEPEN, b = q 


2. Um jogador faz uma série de apostas de $1.. Ele decide abandonar o jogo 
quando seu ganho líquido alcança $25 ou sua perda líquida alcança $50. 
Suponha que tanto a probabilidade de ganhar como a de perder uma aposta 
são iguais a 1/2. 


(a) Determine a probabilidade de que tenha perdido $50 ao abandonar o jogo. 
(b) Determine sua perda esperada. 
(c) Determine o número de apostas que fará antes de abandonar o jogo. 


3. Suponha que o jogador descrito no Exercício 2 está jogando roleta e que suas 
probabilidades reais de ganhar e de perder uma aposta são 9/19 e 10/19, respec- 
tivamente. Resolver (a), (b) e (c) do Exercício 2 usando as probabilidades reais. 

4. Um jogador faz uma série de apostas com probabilidade p de ganhar e probabi- 
lidade q > p de perder cada aposta. Ele decide jogar até ganhar M, dólares 
ou perder М» dólares, onde М, e M, são números inteiros positivos. Ele 
pode apostar 1 ou 1/2 dólar de cada vez. Mostre que é mais provável ganhar 
M, dólares antes de perder M, dólares apostando 1/2 dólar de cada vez. 
Que generalização deste resultado parece plausível? 

5. Derive (14) resolvendo a apropriada equação de diferença finita. 

6. Seja 5, um caminho aleatório simples com p=q=1/2 е seja а < b. Ob- 
tenha Pan (xy)e Gu, (У) paraa<x<b ea<y<b. 


7. Seja $„ um caminho aleatório simples com р = q = 1/2. Obtenha P (о) (x, y) 
e С о (x, y). para x 20e y>0. 

8. Seja S, um caminho aleatório simples com 0 < q < p. Obtenha Р, (x, y) 
е G, (x,y) para x>0 e у>0. 

9. Seja $, um caminho aleatório simples com 0 « q <p. Obtenha P ка l,y) 
е G w (-1, y) para y « 0. 

10. Suponha que pontos se distribuem no espago tridimensional segundo um pro- 

. cesso de Poisson de parámetro А = 1. Cada ponto do processo é tomado como 
о centro de uma esfera de raio r. Seja X о nümero de esferas que contém 
a origem. Mostre que X se distribui segundo uma distribuição de Poisson de 

+ média (4/3)лг?. 

11. Escolhe-se um ponto aleatoriamente em um círculo de raio К com centro 
na origem. Toma-se o ponto como centro de um círculo de raio X onde 
X é uma variável aleatória com densidade f. Determine a probabilidade p 
de que o círculo aleatório contenha a origem. 

12. Suponha que se escolhe n pontos independente e uniformemente em um 
círculo de raio R com centro na origem. Toma-se cada ponto como o centro 
de um círculo cujo raio tem densidade f. Obtenha em termos de p do Exer- 
cício 11 a probabilidade de que exatamente k círculos contenham a origem. 

13. Obtenha a resposta do Exercício 12 para o caso em que se substitui os n pontos 
por um número aleatório de pontos tendo uma distribuição de Poisson de 
média лК?. 

14. Suponha que se distribui aleatoriamente N bolas em r caixas, onde № tem 
uma distribuição de Poisson de média A. Seja Y o número de caixas vazias. 
Mostre que Y se distribui binomialmente com parâmetros r e р = e-?^/r, 
Sugestão: se X; é o número de bolas na caixa, i, então X4, X5,..., X, são 
variáveis aleatórias independentes com distribuição de Poisson de parámetro N/r. 

15. Usando o resultado do Exercício 14 podemos derivar facilmente a probabilidade 
pk(r, п) de que exatamente k caixas estejam vazias quando se distribui л 
bolas aleatoriamente em 7 caixas. Para tanto observe que 


~ Е УЕН Е A >л) 
n=0 
= Det pdr, n) 
n=0 . 


[1] 


Р(Ү = К) = (1) EM — e MM 


ao 


Эйс z | An n) s É ) e A(r— ora - о) k, 


Igualando os coeficientes de A”, derive novamente a Equação (16) do Capítulo 2. 
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16. 


T7: 


18. 


19. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 


Suponha que os tempos de falhas sucessivas de uma máquina forme um processo 
de Poisson em [0, œ) de parâmetro А. 


(a) Qual é a probabilidade de que ocorra pelo menos uma falha no intervalo 
de tempo (t,t+h), л> 0? 

(b) Qual é а probabilidade condicional de pelo menos uma falha até o tempo 
t+h, dado que nenhuma falha ocorreu até o tempo t? 


Suponha que temos um processo de Poisson de parâmetro А em [0, =). Seja 
2, a distância de t ao ponto mais próximo à direita. Obtenha a função de 
distribuição de Z,. 

Suponha que temos um processo de Poisson de parâmetro А em [0,<). Seja 
Y, a distância de t ao ponto mais próximo à esquerda. Faça Y; = t se 
não existe nenhum ponto à esquerda. Obtenha a função de distribuição de Y,. 
Para Z, e Y, dos Exercícios 17 e 18, 


(a) Mostre que 4; e Y, são independentes, 
(b) Obtenha a distribuição de Z; + Ү,. 


Suponha que partículas chegam a um contador de acordo com um processo 
de Poisson de parâmetro A. Cada partícula provoca um pulso de duração 
unitária. O contador registra a partícula se, e somente se, não há nenhum 
pulso presente no momento da chegada. Obtenha a probabilidade de que 
uma partícula seja registrada entre os tempos t e t+ 1. Suponha que t>1. 


Considere um processo de Poisson de parâmetro А em [0,º) е seja T uma 
variável aleatória independente do processo. Suponha que T tem uma distri- 
buição exponencial de parámetro v. Seja Ny o número de partículas no 
intervalo [0, T]. Obtenha a densidade discreta de N+. 

Resolva o Exercício 21 supondo que T tem distribuição uniforme em [0, a], 
a OQ. i 

Considere dois processos independentes de Poisson em [0,%) tendo parâmetros 
М, e M, respectivamente. Qual é a probabilidade de que o primeiro processo 
tenha um evento antes do segundo? 

Suponha que n partículas se distribuem independente e uniformemente sobre 
um disco de raio r. Seja D, a distância do centro do disco à partícula mais 
próxima. Obtenha a densidade de D,. 

Determine os momentos da variável aleatória D, do Exercício 24. Sugestão: 
obtenha uma integral Beta por meio de uma mudança de variável. 

Considere um processo de Poisson de parâmetro А em R”. Para um conjunto 
А que tem volume finito, seja N4 o número de partículas em А. 


(a) Determine ENA. 
(b) Se А e B são dois conjuntos com volumes finitos, determine E(NANB). 


as 


ттт ннан АБАБЕАРШАШБИНАШШЕШЕАЕШШЫЕШШШШШЫННЕНЫШИЫДЫД 


! 


27. Sejam Ai, 45, ... , Аһ n conjuntos disjuntos com volumes finitos, e de 
uma forma semelhante sejam B,, B5, ... , B, n conjuntos disjuntos com 
volumes finitos. Para números reais «1,...,Qn e 8,,...,Вп, seja 


n 


00) = Y Bx. e SOS У алб) 


Para um processo de Poisson de parâmetro À mostre que 


E (X, una) (È fins) 


= 42 (| f(x) dx) io g(x) dx) +4 I /(х)д(х) dx. 


28. No Exercício 27 mostre que 


Var ( > Na) = À E f?(x) ах. 


= 1 


є 


T > - 3 є E 
29. Considere um processo de Poisson de parâmetro А em R^ eseja Dm- a dis- 
tância da origem à m-ésima partícula mais próxima. 


(a) Obtenha a densidade de D m. 
(b) Obtenha a densidade de Dj. 

30. Suponha que temos um processo de Poisson de parâmetro А no semiplano 
superior de R?, isto é, o processo de Poisson está no subconjunto S = 
= (х,у):у >0 de R*. 

31. Considere o seguinte sistema. Os tempos de chegada de partículas no sistema 
constituem um processo de Poisson de parâmetro А em [0, о). Cada partícula 
permanece no sistema durante um certo tempo independente dos tempos de 
chegada das partículas e independente dos tempos de permanência de outras 
partículas. Suponha que os tempos de permanência das partículas se distribuam 
exponencialmente com parâmetro comum и. Seja M(t) o número de partí- 
culas presentes no sistema no tempo /. Determine a distribuição de M(t) 
através das etapas seguintes. 


(a) Suponha que uma partícula chega, de acordo com uma distribuição uni- 
forme em [0, t] e, permanece durante um tempo exponencialmente 
distribuído com parâmetro u . Obtenha a probabilidade p; de que a 
partícula esteja no sistema no tempo f. 

(b) Usando o fato de que, dado N(t) = n, as partículas se distribuem inde- 
pendente e uniformemente em [0,7], mostre que 


кми) = kI NE = л) = (p) ra — pr^ 


(c) Mostre a seguir que M(t) se distribui de acordo com uma distribuição 
de Poisson de parâmetro Atp,. 
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27. A desigualdade de Chebyshev mostra que a = 781 será suficiente (ver também 
a resposta do Exercício 46 do Capítulo 7). 
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CAPITULO 5 
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2. Fx) = 0,х < 0; F(x) = XR, 0 < x < Rê; e Fx)-lx»R. 
3. Fx) = 0,х < 0; F(x) = х3%/®ЕЗ,0 < x < ЖОБО РК) = [o cR) 
4. Р(х) = 0, х « 0; Е(х) = xja, 0 = x <a; е Ех) = para x >a. 
5. Р(х) = 0,x < 0; F(x) = Qhx — х2У/ 5 0 < x «Am ce Fx)-1xA 
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6. Р(х) = 0, х < 5У3/2; F(x) = v Ax? — 352/5, 5У3[2 < х < 5; 
е Б(х) = 1, х >з. 
7. F(x) = 0х 0: н) = x2 0z x< 1; ЕО) = —1 +7х =(@ уж; 


[<p Se Re) x2. 


В m= 11108207. 


9. + = — log 0,9/100 log 2 = 1,52 х 10-2. М 
10. Fg) = 0,х < 0; PO = х/а,0 < х «al; е F()-lxza[. ! 
11. (а) 7/12, (b) 1/3, (6) 1/6, (d) 5/12, (e) 1/2: 

12. (a) (iv) F(x—) = F(x) para todo x; 
(b) (ii) F é uma função não-crescente de x e (iii) F (—с°) = 1 e F(®%)= 0; i 


(c) (ii) F é uma função não-crescente de x, (iii) F (—) = 1 e (е) = 0, = 
e (iv) F(x—) = F(x) para todo x. 

13. Fx) 20,x < —5; F(x) = (x + 10/20, -5 x x < 5; e Р(х) = xz 5. 

14. e! — e7?. 

15. f(x) = 1/2(|х| + 1)? = F'(x) para todo x. 

16. f(x) = 3x?]R5,0 < x < R; e f(x) = 0 para outros valores de x. 

TZ Vo) 0 «ox ОЕ sod. s xx = 00е f(x) = 0 para outros valores 
dex. 

18. О) = f) * f(-» y » 600 = 0, y = 0. 

19. f(x) = 2хд(х?),х > 0; e (у) = f y)/2 Уу, y > 0. 

20. Se В > 0, então fy (y) = Вуё- 1, 0<у< 1, e fy(y)=0 para outros va- 
lores de x. Se B < 0, então fy) = —8y-!, y> 1, e /у(у) = 0 para 
outros valores de x. 

21. O) = у? КА — »)»,0« у < 1, e fy(y) = 0 para outros valores de x. 

23. ф(х) = (x — ajb- a), – о < x < co. 

24. Y tem uma densidade exponencial de parámetro A/c. 

25. Multiplicar g por 12. 

26. f(y) = 16/902 + (y — ap, – о < y < о. 


27. Р(х) 2 0, x < —1; Ех) = 12 + Iljxarsen x, -1 € x € 1; Р(х) = 1, x > 1. 

Кх) = Шау = x1; C13 < x< 1, e f(x) = 0 para outros valores de x | 
28. f(x) = Alxje ^*, -0 < x < 00. Ұ 
29. Х—а ea — X têma mesma distribuição. F(a — х) = 1 — F(a + x) para todo x. 

30. Ф(х) = 1/2 + 1/2 erf (x М2) = = х= оо. 
2 2 2 
31. y) = —— e? ?7, 0 < y < ©, e fy(y) = 0 para outros valores de y. | 
oV 2n ч/- 
32. HO) = — 08 exp [- (log у — д)?/2с?],0 «:y < co, e fy (y) = 0 para outros 
суу 2л 
valores de y. 
33. 0,6826. 34. (X — wo tem a distribuição normal padrão. 
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à gaga нйн нынын ныны ыс 


| 35. f(—6) = 0,0030, 4455) = 0,0092, /,(-4) = 0,0279, (3) = 0,0655, 


| 0-2) = 0.1210, 3-1) = 0,1747, 400) = 0,1974,. f4(0) =0,1747, 
fy(2) = 0,1210, 43) = 0,0655, fy(4) = 0,0279, — fy(5) = 0,0092, 
fy(6) = 0,0030. — 445) = 0 para outros valores de y. 
36. u = 160.5 = 296 Р(Х > 200) = 0,0885, Р(Х > 220 | X > 200) = 
= 0,244 (24.4°/ 
b 38. 2 segundos. 
: 39. Com distribuição geométrica de parámetro 1 — e^. 
40. (e) g(t) = X, t > 0, onde А éo parâmetro da distribuição exponencial; 
(f) melhora para a < 1, deteriora para а > 1 e permanece o mesmo para а = 1. 
41. Densidade gama Г(е, A/c). 
1 
р 43. hO) = ES 377! e>? у> 0, e (у) = 0 para outros valores de y. 
(a) 
44. о(у) = ` у, у> 0. 45. ф(х) = [Ф109], -1« x < 1. 
46. Ф-!(0,1) = – 1,282, 471(0,2) = — 0,842, $71(0,3) = — 0,524, 
$^!(0,) = — 0,253, Ф-!(0,5) = 0, $-1(0,6) = 0,253, 
$7 (0,7) = 0,524, $^! (0,8) = 0,842, $7!(0,9) = 1,282. 
47. и + 0,6750. 48. 1. 49. 0,82. 
CAPÍTULO 6 
= 2 — А 1 W—z-—c 
LET CORE TON К С 20. ig). xi 
w,z(W ( b d fw,zw, z) i b d 
2. Fw gw, 2) = F(vw, Ут) — F(— vw, Ут) — F(vw, — Ут) + F(— Nw, — v z) 
е faz) = WO, V2) + (-У»,У D+ SM УЗ) 

AV wg ^  f(- Vw, =V 2)) 
рага w,z > 0 e Fyz(wz) e fw.z(w, z) são iguais a zero para outros valores de 
wez. 

3. (a) 3/4, (b) 5/12, (c) 3/4; estes resultados são obtidos facilmente determi- 
nando as áreas dos quadrados unitários adequados. 
4. 1 —е—1!24% 
t 5. 3/8. 6. 1/3. 
7. X distribui-se exponencialmente com parámetro X. Y tem a densidade gama 
ГЭ; А). 
РҮ (Ху) жж e — Дх 0 ж ух = у; 
Ру у(х, у) = 1 — e?(1 + ду), 0 < y < х;е Руху) = 0 para outros valores 
-—E de x e y. 
Boa =) (bec Da + 2), 
(с) fy(X) = (а + 201] — х)**!‚0 < x x Le /у(х) = 0 para outros valores de x. 


fy(y) = (a + 2)у**!‚,0 < у € 1, e fy(y) = 0 para outros valores de y. 
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10. 


11. 


12. 


T3 
valores de z. 
14. f) = pl z e) dx, —o < z< ©. 
15. (a, — Dai + q — 2). 16. n(u — щш, о? + 02). 
17. 00) = Ler, (20; e fir) = 0, г 0. 


28. 


30. 


31. 
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de 
: Ду-х\(®@) = 2. ( E " 0O<z<b-a,e fy-xi(z) = O para outros 
£a а 


. Јуү(2) = | 1 ft zix)dx. 


Р = A Pe), О ЕУ) = cO 
. Ах) = Ша + 2) 0 ела 02 = 0: 
‚ Densidade Beta de parâmetros o4, e q. 


‚ (0 fra) = PAD x x € ye feo 


. Ф(3/2) = 0,933. 
. Densidade Beta de parámetros х; + у e a5 +n- y. 
‚ УО) = aft Ky + В), y > 0, e fy(y) = 0, у x 0. A densidade condicional 


. c = «15/4z. X distribui-se segundo m(0.16/15) e Y distribui-se segundo 


n(0,4/15). 


Љ-х(2) = | KO) fkz + х)ах. 


ELLER 


(а) /х+у(2) = (E e) cope gr е0 05 0. 
А — 2 


O) у) — 0,2 € 0p.) —1—7750s7€ E : 
fry" 2 1), 1 62 0. 


Ду) = = t ge OS SITE ео pagas 


fx«y(z) = О para outros valores 


с? 


-œ |X] 


= 0 para outros valores de x e 2. 
(b) fl) = (a + DG — A — x,0xx«y«1, 

е  fyx( | x) = О para outros valores de x e y. 

(c) хб [жу == (у xf8. 1/4). 


de A dado Y = y é a densidade gamal(a + 1, f + у). 
м/п e 
AO) = А рсе ужб, e A= p<0: 
с 

ЛО) = 022,0 =) 100) = —y^ Е 3»—32,1: «2; 
fy») = у/2 — 3y + 92,2 < y € 3, е fy(y) = О para outros valores de y. Кү 
Р(Х, + Х„ + Xam 3) = 5/6, à 
fx, xx X2 Хз) = 1)x,x2,0 < x4 < x? < x, <1,eigualazero para outros. 


valores de x4, X2 e хз. | 


32. 


33. 
34. 
35. 
36. 


37. 
38. 
39. 
40. 


41. 


fx (x) = (loge x)2/2,0 < x < 1, e igual a zero para outros valores de x e y; 


(а) fx, x, (x) = n(n — D(y — x? 0 < х < у < 1, eigualazero para outros 
valores de x e y ; 

(b) fa(r) = n(n — D — к)" 2, 0 < r < 1, e zero para outros valores de r. 
(c) Densidade Beta de parámetros k e n — k+ 1. 


Exponencial de parâmetro nÀ. 
х0"/2)-1 e=*/2/2"12 T(n/2), x > 0, e O para outros valores.de x. 
Beta de parâmetros m/2 e n/2. 


aX + bY e bX — aY distribuem-se conjuntamente como duas variáveis 
aleatórias independentes, cada uma com a densidade normal n(0,a? + b?). 


1 
Sx xr, 2) = №) f(z — x). 
Uniforme ет (0,2) рага 2 > 0. 
Uniforme em (0,2) para 0 <z < c, euniforme em (z –с,с)рагас<2< 2c. 
(a) n(0, 1), 


21 — p?) 
TM 2 
(c) fxr, у) = — E EA exp Е s 2) uU 2 
210,0,;V 1 — p? Ер) 01 


meis esp. 


(d) n (а ee um аё = 2) 


PN 22 
(b) (и, 2) = As aD - exp 5 mt i ed 


91 
2 2 2 №2 
СА a = ( | /( А ү 
у +1 w+1 +1 


CAPITULO 7 


. a,/(a, + a3). 


. Z terá expectância finita quando o, > 1 e q 2 0. Neste caso 


EZ = a5[(a, — 1). 


. ev 2|n. 


. X,/tem uma distribuição geométrica de parámetro (1 — e~ Ae). 


EX, = ee * — е8), lim, EX, = 1/A. 


. EX" = I'(a, + a3) I(a, + т)/Г(«,) Ta + а + m). 


Var X = aaa; + az + Ia, + а)? 


маг (=) (5) - 


. do(a, + а, — Dia, — Da, — 2) para a, > 2. 


ER SD) Маг к 51. 
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10. 
11. 
12. 
13. 
14. 
15. 


16. 


19. 


20. 
21. 
22. 
26. 


27. 
28. 


33. 
34. 


35. 
36. 
40. 


41. 
42. 


43. 
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EX = 2R/3, Var X = R?[18. 

ЕХ = 0, Var X= RJA. 

EZ = су п]2, Var Z = 042 — n/2). 
EY = 2o« 2/л, Var Y = o?(3 — 8/7). 
ЕХ = 0, Var Х = 1/2. 


(а) E| X | = oV2]n, Var | X | = о2(1 — 2/7); 
(b) ЕХ? = 0º, Var X? = 26^; 
(с) Ee'* = eem. Var e'* = е29?1? ut e. 


Ee'* = G 2 para t < à. 17. EX" = I (a + r)[T(a)A" para r > — x. 
t= 

ЕХ, = Кп + 1), Var X, = k(n — k+ Dn + Dn + 2). 

ER = (n — 1)/(n + 1), Var R = Un — Dn + (n + 2). 

р = 1/4. 

EZ = uol), Var Z = a(o?a + о?  42)[A?. 25. p, > 0,458. 


PIIA ЕО ИЕГИ x] 2 — nd = xe 
E[Y | X = x] = 0 para outros valores de x. 


E[X |Z = z] = a,z/(a, + a2) para 220 é о caso contrário. 

E[IH | Y = y] = (a, + ya, + а, + n, y = 0,1,2,..., n, eO para outros va- 
lores de y. 

Р(Х < x) ж Ф((Ах — a)/ ~ a). 

(a) ЕХ? = o? e Var X? = 20º. 

(b) Р(Х? + + X2 < x) x Ф((х — na?)Ja? V 2n). 

(а) 0,921. (b)0,842. (с) 23,26. (d) 27,71. 

0,9773. 37. 0,02. 38. 0,0415. 39. 0,0053. 

(a) /х(х) ж 2712 ф(х — DINA), | 

(b) А00) ж Dl + 1/2 — 2v) — (x — 1/2 — JJ 2). 

1/N nm. 

l/Vnz. A aproximação (15) não pode ser aplicada diretamente porque o 
máximo divisor comum do conjunto x — 1/x é um valor possível de S, é dois e 
não um. 

0,133. 44. 0,523. 45. п = 6700. 46. 551. 


CAPÍTULO 8 


. My(t) = (е — eb — ats 0, e Му(0) = I. 
. e" My(bt). 
. (а) My(t) = [pl — e – pp, -œ < г < log (1/1 — p). 


5. 
6. 


10. 
12. 
14. 
21. 


23. 


(b) (2n)! 

(a) MO = npe(pe' + 1— p^! e 

LM = пре(ре + 1 — py! + n(n — Dp?e?(pe' + 1 — pro? 
Jean. 11. p — е1 — p). 

[2/1 — ed — py]. 13: pu =. 


pt) = Ф, (еі). 
(a) Фху+ү(ї) = E e 9ceyya(0) = е! 


А о 


(b) іт Р B < +) = Ox), -© < х < œ. 
VÀ 


CAPITULO 9 


. (a) 1/3, (b) 0, (o 1250. 
. (a) ((10/9)59 — (10/9)75)/(1 — (10/9)75) x 0,93, 


(b) x $44,75, 
(c) = 850. 


. Para x = y 


b-a 


EE E ce EE 
nbn 20 — а — ») 


e 
Gia b, У) = m € t 
b-a 
Para x < y 
Papx, у) = ке 
у-а 
е 
2(x — aXb — у) 
Саъ, у) = т . 
Para x > y 
Рау У) = Bc 
Ву 
е 
Саух, У) = Ar- ap c : 
b—a 
. Para x = y 
Р(оу(у, у) = 1 — 1/2y е Go, у) = 2y-1. 
Para x < y 
Pox, У) = х[у е Gox, y) = 2x. 
Para x > y 


Pox, у) = 1 е Сох, у) = 2y. 
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8. Prax = y 


Р„(у, у) = 1+94-р е GOI) = d der at 
= 0) 
Рага х y 
Р(х,у) = 1 e G(x, y) = Шр — q). 
Para x > у 
ky Еи 

P(x, у) = (1 e G(x, у) = 41р) 

р p-—dq 


9. P (-1, -) = 4 e Go(-1, -1) = N 
р 


Para y < –1 
Po- 1, у) = Е Sn e Gol p= rA 
11. р = = $ (f xf(x + adx ds 12. (1) pa-p. 
13, (9КР) iue, 15. риб", n) = (1) Y c» ( Е | (1 Е DER 
k! к] у= j r 


16.00 1-—6 7, (Бут е”. 
17. Бб) = 0,x «0; € El)=-1-2,x2 0, 
18. Fœ) = 0, х < 0; Р(х) = 1 e", 0xx«t; e Р(х) = 1,х2 7. 
19. (b) 5.200 = 050.00 1 - СЕРИРО = 2; 
е PFy(x)-1-e^( b AM)ESx- оз. 
20. Je”? 


21. fy (k) = VAIO + vř*!, k = 0,1,2,..., e zero para outros valores de К. 


Kk Lyn sd 
22. fy. (k) = Е L - е^ У E ‚ k=0, 1, 2,..., e zero para outros valores de К. 
J 


^а jzo Л! 


29.3504 + Л). 


2пх жү 
А == ‚ 0 < х < r,e zero para outros valores de x. 
r / 


25. ED} = wr (= + yr n J 


26. (a) A?|A|? + 2/4], (Ы) 2?|4| |B| + 44 A BJ. 


29. (a) fp, (r) = 3(4n4/3y"r 3"- 1074 "272/30 — 1)!,r > 0, e zero para outros valores 


de r. 
(b) Densidade gama Г(т, 44/3). 


30. (a) fp, dr) = (nàY"r?"n-1 ec rn/22"-1(m — 1)!, r > 0, e zero para outros valores 


de r 
(b) ED, = (An/2)7 12 T(m + 1/2) 


e ED2 = zu 
(m — 1)! лА 


t EE = ш 
31. (а) p, = A g 79 ds = 1 ri 
t Jo ut 
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TABELA I 


китти dão 


Tabela I Valores da função de distribuição normal padronizada 


dz) = e uen du = P(Z < г) 


о-оо рало їз боо о о А 


Reimpresso com а permissão da Editora Macmillan do original “Introduction to Probability and 
Statistics", segunda edição, de B.W. Lindgren e G.W. McElrath, Copyright © 1966 by B.W. 
Lindgren e G.W. McElrath. 
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аа 4 


Tabela I Valores da função de distribuição normal padronizada 


1 2 3 4 5 6 7 8 9 


B 


.5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359 
0398.5438 .5478 .5517 5557 5596 .5363 5675  .5714- .5753 
.5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141 
.6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517 
.6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879 
.6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224 
1257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549 
.1580 .7611 .7642 .7673 .7703 .7734 .7764 .7974 .7823 .7852 
7681 7910 7939) 7967 799518023 8051. "8078 8106. 8133 
.8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389 
:8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621 
.8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830 
.8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015 
9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177 
9192 .9207 .9222 .9236 9251. 9265 9278 9292 9306 9319 
9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9430 .9441 
9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545 
9554 .9564 .9573 .9582 9591 9599 29608 9616 -9625 „9633 
.9641 .9648 .9656 .9664 .9671 .9678 .9686 .9693 .9700 .9706 
‘9713 .9719 „0726 97325 9738 -9744 9750697560 9762: 9767 
9772. 9778) «9783 9788 9793 9798 9803 -9808 9812 9817 
9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857 
.9861 .9864 .9868 .9871 .9874 .9878 .9881 .9884 .9887 .9890 
2.3 .9893 .9896 9898 ..9901 9904 9906 .9909...9911- 9913 9916 
2.4 :9918 9920 19922 9925 9927 9929: 9931 9932 .9934 9936 + 
2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952 
2.6 .9953 .9955 P9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964 
2.7 -9965 9966. 9967 9968 9969: “9970 ..9971....9972. .9973 9974 
2.8 NOTA 9975 99769977 9977 9978 -9979 10979 9980" 9981 
2:9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986 P 


кә — оромол ш кә ороо `з сул эю о 


NN N – — — кл кз эш кш мш мш мш 


3: 9987-9990 29993 09957 9997 Е 99989998 29999 29999 1,0000 


Nota 1: Se uma variável normal X não está na forma padrão seus valores devem ser padro- 
х— 
nizados: Z = (X — u)/o. Istoé Р(Х<х)= e(—^). 
с 
Nota 2: Para probabilidades bicaudais ver Tabela 1b 
Nota 3: Рага z > 4, Ф(х) = 1 para 4 casas decimais; para 2 < —4, Ф(2) = 0 até 4 casas 
decimais. 
Nota 4: As entradas opostas 2 — 3 são para 3,0; 3,1; 322; etc. 
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INDICE REMISSIVO 


Álgebra dos conjuntos, 7 
Álgebra sigma, 7 
Álgebra sigma (o-álgebra) de subcon- 
junto, 7 
Amostra aleatória, 102 
Amostragem com reposição, 28 
Veja também distribuição binomial 
Amostragem sem reposição, 29, 31. 
36-37,52 
Amostra ordenada, 27-30 
Amostras desordenadas, 31-33 
Amplitude, 164 
Aproximação de Poisson à distribuição 
binomial, 70 
Aproximação normal, 192 


Caminho aleatório, 225 

simples, 229 
Caminho aleatório simples, 229 
Coeficiente binomial, 31 
Coeficiente de correlação, 100, 182 
Combinações, 31-33 
Complemento de um evento, 3,6 
Convolução, 150 
Covariância, 97, 106, 182, 184 


Decil inferior, 136 
Decil superior, 136 


Decis, 136 
Densidade. Veja Densidade descontínua; 
densidade em relação à integração 
Densidade com relação à integração, 159 
Beta, 152 
bidimensional, 147 
condicional, 108, 157, 164 
conjunta, 144, 147, 161, 162 
exponencial, 121 
F, 169 
gama, 132 
marginal, 145, 147, 162 
Maxwell, 176 
normal, 128 
Rayleigh, 175 
simétrica, 126 
t, 170 
unidimensional, 144, 147 
Densidade condicional, descontínua, 108 
com relação à integração, 157, 164 
no método de Bayes, 159 
Densidade conjunta, descontínua, 62 
com respeito para integração, 144, 
147, 161, 162 
Densidade marginal, descontínua, 62 
com relação à integração, 145, 162 
Densidade simétrica, 125-126 
mediana, 136-137 
momentos, 184 
Desigualdades de Chebyshev, 102 


Desigualdade de Schwarz, 100 

Desvio padrão, 95, 182 

Distribuição, 51 

Distribuição Beta, 152 

Distribuição bidimensional, 147 
normal, 177 
normal padrão, 148 

Distribuição binomial, 51 
aplicação da desigualdade de Cheby- 
shev, 103 
aproximação normal, 194, 196 
aproximação de Poisson, 69 
função geratriz de momento, 204 
função geratriz de probabilidade, 73 
média, 84, 90 
provas de Bernoulli, 66 
soma das variáveis aleatórias bino- 
miais, 75 
variância, 98 

Distribuição binomial negativa, 55 
aproximação normal, 192 

. função geratriz de probabilidade, 73 

média, 96-97 
soma das variáveis aleatórias bino- 
miais negativas, 75 
variância, 96-97 

Distribuição de Bernoulli, 66 
Veja também distribuição binomial 

Distribuição de Cauchy, 124-125 
soma das variáveis aleatórias de Cau- 
chy, 222-223 

Distribuição de Maxwell, 176 

Distribuição de Poisson, 56 
aproximação da distribuição bino- 
mial, 69 
aproximação normal, 191 
função geratriz do momento, 204 
função geratriz da probabilidade, 75 
relação com a distribuição gama, 134 
soma da variáveis de Poisson, 75 
variância, 97 

Distribuição de Rayleigh, 175 
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Distribuição de x?, 168-169 


média, 182 
momentos, 183 
variância, 183 


Distribuição exponencial, 121, 129, 210 


função característica, 211 

função geratriz de momento, 204 
momentos, 183 

propriedade exponencial, 130 

soma das variáveis aleatórias expo- 
nenciais, 150, 163, 173 

tempos de espera pelo processo de 
Poisson, 240 

variância, 183 


Distribuição F, 169 
Distribuição gama, 132 


aproximação normal, 192 

distância às partículas no processo 
de Poisson, 239 

função geratriz de momento, 204 
momentos, 183 

quocientes das variáveis aleatórias 
gama, 156 
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envolvendo variáveis aleatórias, 57 

Problema do aniversário, 29 

Problema do cupon, 45 

Problemas de ocupação, 42 

Problemas de encontro, 31, 40 

Processo de Poisson, 239 
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Variáveis aleatórias mutuamente inde- 
pendentes. Veja variáveis aleató- 
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MÉTODOS EST ATISTICOS EM PESQUISA E PRODUÇÃO 
DAVIES/GOLDSMITH: 


Trata-se da tradução da quarta edição de um livro consagrado no as- 
sunto. Muito do sucesso deste livro se deve ao fato de ter sido escrito por 
uma equipe de estatísticos, químicos, engenheiros e físicos com bastante 
experiéncia em trabalhos de pesquisa. Daí a énfase dada aos aspectos prá- 

7" E ticos da análise estatística de dados experimentais, às condições básicas a 
serem satisfeitas e às interpretações dos resultados finais. Exige um conhe- 
cimento médio de Matemática e se destina a profissionais de pesquisa e 
produção e, principalmente, aos estudantes de ciências em geral. 


